Así combate Google el ‘contenido spam’ en las búsquedas

Cómo filtra el spam en la web Google

El spam es un tipo de contenido que no tiene utilidad para el usuario. Aunque se suele utilizar habitualmente para referirse a correos basura, también las páginas web y los blogs pueden producir spam. En este caso, estaríamos hablando de contenidos sin valor real para el usuarios, ya que han sido creados para posicionar artificialmente una página web o un promocionar un producto de forma poco correcta.

Google lucha contra el spam para que el 99% de los resultados de búsqueda que llegan al usuario estén libres de contenido de baja calidad.

En este sentido, Google lleva años perfeccionando sus algoritmos e introduciendo mejoras en el posicionamiento SEO para luchar contra este tipo de páginas web que buscan engañar a la gente. Para ello, el equipo de Google Search ha creado su propia Inteligencia Artificial (IA) que lucha contra el spam de forma independiente, siendo tan eficaz que es capaz de detectar nuevas tendencias en el spam y bloquearlas.

Google ha señalado que esta IA ha sido capaz de identificar, con un 80% de precisión, sitios web con contenido «scrapeado», es decir contenido copiado o generado automáticamente, sin la supervisión de un humano. Al mismo tiempo, ha sido capaz de identificar con una precisión del 50% sitios hackeados por spammers.

Google descubre cada día más de 40.000 páginas con contenido calificado como spam. Para ello, en primer lugar utilizan las arañas de Google, que son unos bots automáticos que rastrean las páginas web y sus contenidos de forma automática. A continuación, se utiliza la información de los sitemaps XML en Search Console. Aquí es donde entra en juego la IA de detección de spam de Google, ya que es capaz de distinguir cuando es un hacker el que utiliza Google Search Console para solicitar una indexación manual de una página de spam introducida a la fuerza en un sitio web pirateado.

El siguiente filtro son los sistemas que analizan los contenidos que aparecen en las SERP. Al realizar una búsqueda, Google analiza todo el contenido de las páginas web que se muestran, si alguna de ellas tiene indicadores de spam, se bloquea. De esta forma, la información se actualiza con cada búsqueda y Google deja fuera de sus resultados las páginas con spam.

El resultado es que muy pocas páginas con spam se «cuelan» entre el contenido final al que tiene acceso el usuario. En este sentido, Google asegura que el 99% de las búsquedas reciben resultados totalmente libres de spam. En cuanto al 1% restante, cuando un usuario avisa de un problema de estas características, el propio equipo de Google toma medidas manuales para su eliminación. En el siguiente gráfico, se puede observar cómo filtra Google todas estas páginas con spam.

Filtro de spam de Google

Por otra parte, Google también avisa de que la lucha contra el spam es algo que no pueden afrontar ellos solos, ya que los piratas y spammers encontrarían nuevas formas de hacerlo. Por ello, aconseja a los propietarios de sitios web y webmasters que utilicen todas las medidas de seguridad posibles contra este tipo de acciones.

Google, en su documentación para webmasters, ofrece consejos sobre qué hacer para protegerse, así como la forma de utilizar Google Search Console para descubrir posibles problemas de spam o para verificar si un sitio web ha sido pirateado.

Subir