El Helpful Content Update finalizó su primer despliegue el día 9 de septiembre, 15 días después de iniciarse su lanzamiento, el 25 de agosto. Google había anunciado que llevaría dos semanas, con lo que se ha ajustado bastante al anuncio.
¿Y en cuanto a sus efectos? ¿Ha tenido los efectos que describía el comunicado de Google?
Actualizado enero 2023: En diciembre de 2022 se ha desplegado un segundo update, dirigido a clasificar contenidos en todos los idiomas, incluyendo español. Este segundo Helpful Content Update estuvo activo entre el 5 de diciembre de 2022 y el 12 de enero de 2023.
Tipos de contenido y de sitios afectados
En base a lo visto hasta el momento (escribo el día 10 de septiembre por la mañana) parece que el update ha afectado principalmente a casos obvios y extremos de webs con alguna o varias de estas características:
- Contenido automatizado, escrapeado o spineado
- Contenido tomado casi literalmente de otras fuentes, sin aportar nada nuevo o de valor
- Contenido creado con la excusa de aprovechar keywords para lograr tráfico y monetización, aún cuando no se aporta nada nuevo o de valor sobre el tema que el usuario ha buscado
Esto equivale a responder con un claro «sí» a por lo menos tres de las nueve preguntas planteadas por Google en el anuncio oficial del Helpful Content Update, bajo el apartado «Evita el contenido centrado en los buscadores«, concretamente a las preguntas 2 (mucho contenido de diferentes temas con la esperanza de conseguir tráfico orgánico), 3 (uso de automatización exhaustiva) y 4 (resumen de contenido de otros sin aportar valor propio).
Los ejemplos que vamos a ver a continuación también suelen cumplir con creces las preguntas 7 (relleno para tratar de llegar a un número de palabras), 8 (tocar temáticas sin tener una autoridad clara en ellas) y 9 (contenido en torno a preguntas de los usuarios que realmente no tienen una respuesta concreta), como veremos más adelante.
Los nichos y temáticas más afectadas parecen ser entretenimiento (celebridades, cine, TV), letras de canciones, diccionarios o definiciones de conceptos, tecnología (solución de errores de software y tutoriales) y reseñas de productos.
Ejemplos
A continuación ofrezco ejemplos de sitios que me han parecido claramente afectados por el update, dado el momento en el que han perdido visibilidad orgánica, el contenido que ofrecen y las indicaciones ofrecidas por Google en su anuncio. He analizado más sitios, pero en otros casos no me ha parecido ver patrones tan claros como en estos.
Como el update está muy reciente, es bastante probable que se me hayan escapado casos más claros aún. El listado no pretende ser completo, sólo una muestra de distintos tipos webs afectadas, y en cualquier caso no pretendo tener la verdad absoluta sobre por qué han sido afectados, ni siquiera sobre si lo merecían realmente de acuerdo a los anuncios de Google.
Tampoco pretendo juzgar el trabajo hecho en esas webs, ya que no lo conozco, me limito a mostrar correlaciones entre su bajada de visibilidad, lo que veo desde fuera y lo que Google ha expresado que quería solucionar con su update. Trato de ser objetivo, pero por supuesto me puedo equivocar.
Todos los datos y gráficas de visibilidad se han extraído de Sistrix.
Aprovecho para dar las gracias a Lily Ray, que me he ahorrado mucho trabajo con sus tuits sobre el efecto del update y me ha puesto sobre la pista de algunos de los sitios, especialmente los de lyrics. Os recomiendo seguirla en Twitter y leer sus posts sobre updates de Google.
conch-house.com
Típica web con contenido escrapeado de Amazon, apuntando a keywords de baja dificultad, y construida sobre un dominio expirado (era la web de un hotel restaurante y recibía links de Tripadvisor y dominios similares). Esto último explicaría lo rápido que creció en visibilidad orgánica, sólo semanas antes de caer con el HCU.
Llegó a tener 27 puntos de visibilidad en el índice de US de Sistrix, y ahora se ha quedado en 0,0157 (prácticamente nada).
El patrón que sigue el contenido es fácil de ver (las intros prometen una «guía exhaustiva» sobre la categoría de producto de turno y los posts son cualquier cosa menos eso). El contenido consta de una intro spineada o hecha con un patrón determinado, tablas creadas por conexión a la API de afiliados de Amazon y un resumen / escrapeo de las opiniones sobre cada producto.
(Nota: la mayoría de los posts similares al mostrado en el pantallazo se han borrado actualmente del sitio, aunque estaban disponibles hace sólo dos días. En Wayback Machine se puede ver cómo era la web al ser impactada por el update. Ahora mismo todavía quedan en el sitio algunos posts tipo tutoriales de Arts&Crafts, claramente copiados de otros sitios).
wealthycelebrity.com
Un sitio con info sobre celebrities y no tan celebrities, que trata de responder a todas las keywords posibles (edad, riqueza, altura, esposo/a/novio/a, hijos) en torno a cada persona. Estos posts abundan en relleno, keyword stuffing y repetición de datos.
alphanewscall.com
Habla tanto de celebrities, cine y series, como de economía y software. Vamos, sin foco concreto y totalmente orientada a keywords que puedan dar tráfico (es decir, un sí claro a las preguntas 2 y 8).
Se centraban especialmente en keywords del tipo «celebrity + net worth» (¿cuánto dinero tiene x?) o tipo «¿cuándo se estrena la próxima temporada de x?», con contenidos que en lugar de decir simplemente si hay fecha concreta o no, responden a muchas cosas más, resultando en relleno para mantener al usuario en la página.
Tras un rápido ascenso, cayó primero con el core update de mayo y ahora vuelve a caer con el HCU.
eatingexpired.com
Detectado a partir de este tuit de Shay Harel, este sitio parecía inicialmente una automática nacida pra cubrir todas las posibles keywords en torno a preguntas sobre cuánto dura cada tipo de comida o ingrediente antes de ponerse mala. El contenido en sí no es bueno, pero quizá lo peor y más detectable para Google sea que la navegación es simplemente una lista de links, sin disimulo ninguno, e incluso hay por medio algunos encabezados que no tienen sentido, o están escritos en mal inglés:
Para colmo, tiene en común con los sitios de celebridades vistos anteriormente que también ataca a algunas keywords de programas de televisión, con un montón de keyword stuffing y contenido de relleno:
allfamousbirthdays.com
Volvemos a ver los mismos patrones de intentar responder a todas las preguntas sobre una celebridad con mucha repetición y keyword stuffing, pero ahora además con una portada que también recurre a la lista de links y con placeholders para las imágenes:
Este sitio tiene además la peor usabilidad de todos los ejemplos que he analizado (y eso que ninguno era muy usable), ya que los posts realmente tienen más anuncios que contenido real, usando incluso pop-ups en mitad de la pantalla, algo que hacía mucho que no veía.
en-academic.com
Bajo la apariencia de un sitio «legítimo» de definiciones, contiene gran cantidad de páginas copiadas directamente de la Wikipedia, y sospecho que el resto vienen de otras fuentes, como libros antiguos escaneados.
manualzz.com
Un agregador de PDFs de manuales e instrucciones de productos, doftware, etc. Obviamente, nada de esto es original del sitio, proceden siempre de otras fuentes, generalmente la web oficial del producto. Este sitio no hace otra cosa que republicar algo que ya existe, sin aportar ningún valor adicional al usuario.
geniuslyrics.net
Aquí damos con un caso algo más difícil de explicar, de acuerdo a las preguntas del anuncio de Google. Sí, un sitio de lyrics por definición no ofrece contenido original, pero ¿por qué Google ha castigado a algunos sitios de letras de canciones y a otros no?
Una posible teoría, según Glenn Gabe, es que los sitios deben haber obtenido una licencia con los sellos discográficos para poder reproducir las letras. Lyricsgenius y el resto de sitios impactados de este tipo no cumplirían con este requisito; no muestran información sobre licencias en ninguna de sus páginas. Grandes del sector como genius.com, que no han sido impactados por el update, sí lo hacen.
Nos convenza o no este argumento, hay múltiples ejemplos de sitios de lyrics con descensos bruscos de visibilidad:
Me he fijado en geniuslyrics.net, pero hay varios ejemplos similares y con un patrón de pérdida de visibilidad casi idéntico: lyricsjonk.com, lyricsroll.com, lyricsfa.com, lyricsgoo.com…
Listas de dominios que han perdido más visibilidad en EEUU según Sistrix
Por si queréis investigar más ejemplos, os dejo dos listas de mayores «perdedores» de visibilidad en EEUU desde el día qeu se lanzó el udpate hasta el fin del despliegue, siempre según el índice de Sistrix para EEUU.
Perdedores de visibilidad en términos relativos (% de visibilidad)
Perdedores de visibilidad en términos absolutos (puntos de visibilidad)
Hype vs realidad, y qué esperar de cara al futuro
Como suele pasar cuando Google anuncia una novedad o nuevo algoritmo, parte de la industria había tomado las palabras de Google a lo tremendo y se preparaba para un impacto poco menos que catastrófico.
Dadas esas expectativas, el efecto observado por ahora ha parecido quizá puntual y no demasiado intenso, limitado a unos tipos de sitios concretos, en contraste al efecto más generalizado y potente de core updates como el Medic Update de agosto de 2018.
Sin embargo, según Danny Sullivan, representante de Google, el efecto ha sido exactamente el que pretendían y habían anunciado, y no debería sorprendernos que haya afectado sólo a un porcentaje pequeño de sitios, ya que la mayoría de sitios sí tienen contenido útil, de acuerdo a sus criterios.
Como bien recordó a continuación Danny Sullivan, esto no quiere decir que no se pueda esperar más impacto en el futuro. En primer lugar, el algoritmo del HCU seguirá activo, y podría afectar a sitios que se lancen más adelante, o que añadan una cantidad considerable de contenido no útil en un futuro.
Además, Google puede afinar el clasificador, por lo que en los próximos meses se podrían ver efectos más potentes o sobre otros tipos de webs (pero si hacen cambios considerables lo anunciarán). Será un esfuerzo continuo por parte de Google.
Y un aviso más por parte de Google. Incluso aunque no se lancen actualizaciones del Helpful Content, es posible que otros updates, como un core update, o un Product Reviews Update, si fuera aplicable, acaben de mover la balanza en casos en los que el HCU había «marcado» una web, pero sin la fuerza suficiente como para tener un impacto visible en sus rankings.
Queda recordar también que el Helpful Content Update por ahora sólo está activo para búsquedas en inglés. En teoría, y no se ha visto por ahora nada que lo contradiga, no debería haber afectado a webs en otros idiomas (aunque hay casos que aún hay que analizar bien, como wrebs multilenguaje, o webs de letras de canciones con letras de canciones en inglés).
Por ahora no he analizado bien si ha habido bajadas o subidas de visibilidad en España y otros países de habla no inglesa similares a las detectadas en EEUU. Lo anunciado por Google hace pensar que en general no, pero creo que no hay que descartar al 100% algunos casos puntuales, ya que en Google muchas piezas están relacionadas, y, como digo, en España también se dan búsquedas en inglés.
Pero Google ha anunciado su intención de lanzar este update en el futuro para otros idiomas. Por eso me parece importante observar y analizar desde ya qué tipo de prácticas y/o temáticas han sido afectadas por el despliegue en inglés, para saber qué esperar (sin exageraciones ni catastrofismos) cuando llegue el momento.
Ahora toca que habléis vosotros. ¿Ha sido un buen o un mal update por parte de Google? ¿Os han parecido justificados los ejemplos de webs impactadas por el momento?
PD: Para ir con el tema del post, la imagen de portada ha sido creada por IA, gracias al plugin de WP Imajinn, que funciona (y de maravilla) con DALL·E 2.