CATEGORIAS
Noindex
El comando noindex se sitúa en las metaetiquetas para informar a los rastreadores de los motores de búsqueda que la página visitada no debe ser indexada. Los webmasters tienen con esta herramienta la posibilidad de manipular el proceso de indexación de sus páginas.
Implementación
La metaetiqueta noindex se incorpora en el código fuente de un sitio web al final dely en la zona de los Metadatos. Aparece del siguiente modo:
<Meta name = “robots” content = “noindex” />
El contenido de esta página no será indexado y por lo tanto no aparecerá en los SERPs.
Para comprobar si la metaetiqueta ha sido leída correctamente por los rastreadores los webmaster pueden llevar a cabo el Comando de Búsqueda site: para esa página en los motores de búsqueda. Si se ha hecho correctamente la página no debería aparecer en los resultados, SERPs.
Aplicaciones
Con el comando noindex los motores de búsqueda excluyen las páginas indicadas y no guardan su información en la base de datos. Esto resulta muy útil para, por ejemplo:
- Resultados de búsqueda internos
- Contenido / páginas duplicadas
- Contenido copyright
Las páginas marcadas por el “noindex” se encuentran en el Deep Web.
Noindex vs. disallow
En muchos casos los webmasters no tienen claro cuál es la diferencia entre los comandos “disallow” del archivo Robots.txt y la metaetiqueta “noindex”. Generalmente hablando no se recomienda utilizar los dos comandos simultáneamente.
La diferencia es básicamente que con el comando “disallow” los motores de búsqueda no tienen permitido acceder a la URL y con el comando “noindex”, estos pueden acceder pero los rastreadores no pueden indexar la página.
Disallow
El contenido no debería ser analizado como:
- Contenido sensible como datos de registro
- Para volúmenes de datos muy elevados, base de datos de imágenes
- Sin embargo, es posible que la página sea indexada.
Noindex
- El contenido puede analizarse pero no indexarse
- Resultados de búsqueda internos
- No entra en el index
noindex,follow
Si lo que se pretende es que un dominio no sea indexado pero que el enlace sí que sea rastreado, se debe utilizar la metaetiqueta noindex,follow:
<Meta name = "robots" content = "noindex, follow" />
Este comando resulta útil para las categorías que contienen muchísimas páginas. El robot puede entrar en el enlace pero puede indexar solo la primera página de cada categoría, por ejemplo.
Relevancia para el SEO
La metaetiqueta ‘noindex’ es una herramienta de SEO muy útil para evitar que el contenido duplicado sea indexado y, por lo tanto, para evitar posibles penalizaciones y consecuente deterioro del posicionamiento. Además, al añadir el comando follow los rastredaores tienen la posibilidad de seguir pero no de indexar las páginas.
Muchos CMS (Sistemas Gestores de Contenidos) crean muchas páginas de forma automática para que sean indexadas rápidamente. En casos extremos este aumento de páginas se considera una técnica spam pero con el comando noindex se puede evitar ser penalizado.
Cuando se lleva a cabo el relanzamiento de un sitio web el comando noindex facilita el trabajo: mientras se comprueba la funcionalidad del nuevo sitio se bloquea su indexación para no crear contenido duplicado.