Google puede detectar el contenido duplicado antes de rastrearlo

John Mueller de Google reveló en un lugar de reunión de la Central de Webmasters esta semana que Googlebot es capaz de reconocer el contenido duplicado antes de que sea rastreado.

El propietario de un sitio web envió una pregunta preguntándose si Google consideraría que la versión francesa de una página es un duplicado de la versión inglesa y cuándo lo haría.

¿Puede Google determinar cuándo varias páginas tienen el mismo contenido en diferentes idiomas? En caso afirmativo, ¿cómo se gestiona eso en los resultados de búsqueda?

En la respuesta de Mueller reveló que, en algunos casos, Google puede detectar cuando las páginas comparten el mismo contenido sin tener que rastrearlas. Esto es algo que vale la pena tener en cuenta, especialmente cuando se trata de la estructura de las URL de las páginas.

«Lo que sucede a veces es que reconocemos proactivamente que algo es probablemente un duplicado, incluso antes de arrastrarlo. Esto sucede cuando vemos que la diferencia, por ejemplo, está dentro de la URL en algún lugar de un lugar donde generalmente hemos notado que el contenido que se muestra en esta parte de la URL no es tan relevante para el contenido que se muestra en la página.

Así que podría ser algo como que tienes un parámetro de idioma que puedes establecer a cualquier tipo de término, y podríamos haber pasado y probado algo como «language=Inglés», «language=Francés», «language=Alemán», … si encontramos que todas estas páginas muestran el contenido en inglés, excepto quizás «language=Español» que eligió la versión en español, entonces podríamos asumir que este parámetro de idioma es en realidad irrelevante para esta página, y entonces podríamos pasar por alto esa página que en realidad tiene un contenido único».

Desempaquemos esto y mirémoslo desde una perspectiva más amplia. Olvídate de los idiomas por un segundo. Este ejemplo en particular era sobre los idiomas, pero lo que Mueller tenía que decir puede aplicarse al contenido en el mismo idioma también.

Lo que Mueller está diciendo aquí es que Google puede determinar que una página tiene contenido duplicado si comparte parámetros de URL similares con páginas que no son diferentes entre sí.

Obviamente, esta no es una situación ideal, ya que puede haber casos en los que haya páginas con contenido único que tengan parámetros URL similares a los de las páginas que son duplicados exactos.

Los propietarios de los sitios pueden evitar el problema de que el contenido único sea descartado como duplicado prestando atención a la forma en que los parámetros del URL son generados por su sitio.

Mueller admite que no siempre es culpa del webmaster cuando las páginas son tratadas como duplicados, a veces Google también como sus propios «bugs».

La pregunta original, junto con la respuesta de Mueller, se puede ver en el video de abajo a partir de la marca de 27:38.

Carlos Martinez

Periodista y enamorado del marketer digital. Siempre a la ultima sobre la actualidad del marketing y la publicidad.

Deja un comentario