SEO, Sitio web Contenido duplicado y cómo evitarlo
Contenido duplicado, ¿qué es exactamente?
Cuando los bloques de contenido – y especialmente el contenido de texto – aparecen en diferentes lugares de Internet, idénticos o en gran medida idénticos, entonces estamos hablando de contenido duplicado o de contenido duplicado. Esos diferentes lugares en Internet son diferentes URLs, ya sea dentro del mismo sitio web (entonces el nombre de dominio es el mismo, por ejemplo, https://www.dominio.es/pagina1.html y https://www.dominio.es/identicoalapagina1.html) o en diferentes sitios web (por ejemplo, https://www.sitioweb1.es/paginaweb1.html y https://www.sitioweb2.es/identicoalapagina1.html).
Pero ahí no acaba. A veces, existe una versión de un sitio web con y sin ‘www.’, con (en gran parte) el mismo contenido. Eso también es contenido duplicado. Lo mismo ocurre si hay una versión de un sitio web con http:-protocolo junto a una versión con https:-protocolo.
A veces es inevitable duplicar contenidos en diferentes sitios web
Las tiendas web a veces tienen problemas con esto, cuando copian literalmente contenidos técnicos o de otro tipo del sitio web de los proveedores de sus productos. En la práctica, Google reconoce bien estas situaciones y no las considera contenido duplicado. Pero las URL con el contenido del proveedor son las originales y normalmente terminan más arriba en los resultados de búsqueda. Para seguir obteniendo una buena puntuación, los propietarios de tiendas web tendrán que trabajar en un contenido único adicional para optimizar sus páginas web.
Lo mismo ocurre con los comunicados de prensa que se copian en diferentes sitios web e incluso en entradas de blog: mientras Google pueda identificar el original, no hay ningún problema.
¿Por qué Google tiene problemas con el contenido duplicado?
Para los motores de búsqueda como Google, cada url representa una página web distinta. Dos o más urls con contenido casi idéntico, a Google no le gusta eso. Esto no es sólo porque el contenido duplicado se utiliza a veces para tratar de manipular los resultados de búsqueda – no funciona de esa manera hoy en día, Google se ha vuelto mucho más inteligente.
Y lo que es más importante, Google tiene que hacer una elección: ¿qué página obtiene la posición más alta en los resultados de búsqueda? Poner las páginas juntas no es una opción: Los usuarios de Google que hacen clic en un enlace, comprueban el contenido, vuelven a los resultados de búsqueda, hacen clic en el siguiente enlace y luego ven el mismo contenido una mala experiencia de usuario, como lo llama Google. Eso es lo que el motor de búsqueda intenta evitar.
En elmejor de los casos , Google se asegura de que una página o url -normalmente la más antigua- obtenga la posición normal y merecida y que la página o url con contenido duplicado sólo aparezca unas páginas más tarde con resultados de búsqueda. Y si hay un número llamativo de urls con contenido duplicado, especialmente dentro del mismo sitio web, Google se vuelve muy sospechoso y la calificación de todo el sitio web puede deteriorarse.
Una buena idea: ¿muchos sitios web con diferentes nombres de dominio pero con idéntico contenido?
Hay propietarios de sitios web que creen tener la solución para dominar la primera página de resultados de búsqueda en Google: basta con tener un sitio web con un gran contenido para las palabras clave más importantes y luego utilizar ese contenido en otros 9 sitios web, con diferentes nombres de dominio. «Y luego mi sitio web aparece en la primera página de Google varias veces para esas palabras clave, tal vez 10 veces. Genial, ¡todos los visitantes acaban en una web mía!» Así que eso no funciona.
Con un poco de suerte, el sitio web más antiguo se sitúa lo suficientemente alto en Google, pero todos los demás tienen garantizado que el motor de búsqueda los empuje hacia abajo, normalmente varias páginas a la vez.
Contenido duplicado «por accidente»
Algunos casos en los que los propietarios de sitios web luchan contra el contenido duplicado con la mejor intención:
1. Un nuevo sitio web con un nuevo nombre de dominio
A veces es inevitable renovar a fondo un sitio web, por ejemplo, si se quiere hacerlo apto para móviles. A veces, la gente elige inmediatamente un nuevo nombre de dominio. Su primer pensamiento suele ser: «Dejaré el antiguo sitio web en línea. Si luego pongo el nuevo en línea, irá subiendo poco a poco en los resultados de búsqueda hasta superar al anterior». Desgraciadamente, Google no piensa así y el nuevo sitio web siempre tropezará con decenas de posiciones por detrás del antiguo.
Si su sitio web ya tiene buenas posiciones en Google para palabras clave importantes, cambiar su nombre de dominio no es nunca la mejor idea: existe la posibilidad real de que pierda irremediablemente esas buenas posiciones. Pero a veces no hay nada más que hacer. En ese caso, es mejor mantener las URL del sitio web antiguo, SIN el contenido original, pero utilizar una redirección permanente (301) a la URL correspondiente del nuevo sitio web.
Si todo va bien, al cabo de un tiempo Google se dará cuenta de que la antigua url ha sido sustituida por la nueva y el propio buscador hará el cambio. Nota: no siempre funciona, y si lo hace, las posiciones probablemente fluctuarán considerablemente.
En realidad, es una mejor idea, cuando se crea un nuevo sitio web, aprovechar la oportunidad para optimizar el contenido del texto.
2. Pasar de un sitio web con www. a uno sin ella, o del protocolo http:- al protocolo https:-.
La historia de las www. parece ser cosa del pasado y los navegadores son ahora lo suficientemente inteligentes como para añadir este prefijo ellos mismos si es necesario. Pero a menudo los propietarios de sitios web quieren deshacerse de las ‘www.’, y optan por mantener su sitio web en línea, junto a una versión idéntica sin las ‘www.’. Lo mismo ocurre si quieren pasar de un sitio web con protocolo http:- a otro con el protocolo más seguro https:-.
En ambos casos, se obtiene la misma historia que la anterior: Google ‘ve’ dos URLs diferentes, una con ‘www-‘ y otra sin ella, y da una mayor puntuación a la más antigua, la que tiene ‘www.’, mientras que el propietario del sitio web quiere que la que no tiene ‘www.’ esté en la parte superior. Lo mismo ocurre con http: frente a https:. También en estos casos, es mejor que las URL con ‘www’ y las que tienen ‘http:’ existan SIN contenido y CON una redirección permanente a la versión sin ‘www.’ o con ‘https:’. Pero aquí tampoco se pueden descartar las fluctuaciones de las posiciones.
3. Contenido duplicado inevitable en su sitio web/tienda web
A veces es inevitable que haya varias páginas web con un contenido casi idéntico en su sitio web, especialmente en el caso de las tiendas online. Esto puede deberse a su CMS (sistema de gestión de contenidos): no todos los sistemas son capaces de evitar el contenido duplicado por igual. Pero hay muchas otras situaciones en las que el contenido duplicado es difícil de evitar.
No se preocupe, se puede resolver con la llamada etiqueta ‘canonical’, pero más sobre eso en una entrada posterior del blog.