Etiqueta Rel=Canonical

En la categoria:

La etiqueta canonical, conocida en inglés como Canonical Tag, se sitúa en el código fuente de un sitio web y apunta a las URLs canónicas que muestran el mismo contenido, o contenido muy similar. Si se indica cuál es la URL canónica correctamente, esta será utilizada para la indexación de los motores de búsqueda.
Los buscadores puntúan negativamente a los sitios web que presentan contenido duplicado porque no ofrecen valor añadido para los usuarios. Se recomienda utilizar la etiqueta canonical para no ser penalizados por contenido duplicado y usar herramientas como, por ejemplo, el Duplicate Content Checker que te ayuda a reconocer este tipo de contenido.

Usos

La etiqueta canonical se utiliza cuando existe contenido duplicado o cuando existen muchas URLs distintas a través de las cuales se accede a la misma página.

Ejemplo

Cuando se accede a la página inicial a través de distintas URLs (www.domain.com, domain.com, www.domain.com/index.html, etc.). Se pueden encontrar dominios con o sin Barras y con sensibilidad a las mayúsculas. El servidor solo se fija en una dirección IP pero admite variaciones como, por ejemplo, sesiones diferentes o filtros de producto.
Además, el mismo contenido puede presentarse en distintas versiones (E.g. versión de imprenta, PDF, etc.) y publicarse en múltiples sitios web externos.
Por esto se recomienda incluir la etiqueta canonical en todas y cada una de las páginas para que todos los hipervínculos sean redireccionados correspondientemente y, puedan evitarse posibles imprevistos e hipervínculos erróneos.

Tipos de URLs canónicas

Existen dos tipos de URL canónica pero Google recomienda utilizar las URLs absolutas, es decir, la dirección completa del sitio web.
En este caso la sintaxis es la siguiente:

<link rel=”canonical” href=”http://www.example.com/examplepage.htm”/>

El elemento contiene el atributo canónico y se sitúa en el elementodel código fuente. Forma parte de los metadatos del documento y hace referencia a la página estándar. Se utiliza solamente en las páginas que presentan un contenido idéntico al de la página estándar/original.

Ejemplos

http://www.example.com/examplepage.htm

http://www.example.com/examplepage/?session_id=xyz.htm

La primera es nuestra fuente estándar. La segunda es una sesión utilizada generalmente en tiendas online en la que se almacena información relativa a sus usuarios (E.g los productos seleccionados en el carrito de la compra). En este caso, la etiqueta canonical debe integrarse en el elemento de cabecera de nuestro segundo ejemplo.

Si la URL estándar es un documento PDF o cualquier otro tipo de documento compatible con Google, la etiqueta canonical se sitúa en la cabecera del sitio web. La sintaxis es diferente y la integración requiere conocimientos de lenguaje hipertexto (HTTP – Hypertext Transfer Protocol):

<http://www.example.com/examplepage.pdf>; rel=”canonical”

Resumiendo

La etiqueta canonical representa una advertencia. Es decir, si el usuario (E.g. navegador o motor de búsqueda) manda una solicitud, el servidor responde especificando que es una URL canónica. Atención: a veces el servidor debe ser reconfigurado.
Veamos ahora las siguientes dos URLs:

http://www.example.com/examplepage.htm

http://www.example.com/examplepage.pdf

En este caso, la segunda web es la que debería considerarse como fuente estándar . Al ser un documento PDF, la etiqueta canonical se sitúa en la cabecera del sitio web e indica a Google que este documento PDF es el estándar para la indexación.

Origen

Con la ayuda de la etiqueta canonical el webmaster es capaz de comunicarle a los motores de búsqueda qué sitio web debe ser tratado como la fuente estándar y mantener bajo control el contenido duplicado. Por este motivo, la etiqueta canonical es una herramienta muy importante para la optimización de un sitio web en los motores de búsqueda.

Errores frecuentes

Esta herramienta es muy potente y si no se usa correctamente el sitio web podría pasar desapercibido por Google. Para empezar, y lo más importante, el webmaster debe cerciorarse de que realmente el contenido sea idéntico, o casi idéntico, porque solo en estos casos tiene sentido utilizar esta etiqueta.

Ejemplos

Con páginas numeradas con los parámetros rel=”next” y rel=”prev” , no tiene sentido utilizar las etiquetas canonical ya que, desde el punto de vista técnico, no se considera contenido idéntico. Además, el sitio web debe ser accesible: el código de error A 404 debe evitarse. Utilizar las etiquetas Noindex, “disallow” o “nofollow” en combinación con URLs canónicas está penalizado por Google. La etiqueta canonical no debe encontrarse en el cuerpo, body, de un documento y no debe utilizarse repetidamente en los metadatos.