Noindex

El comando noindex se sitúa en las metaetiquetas para informar a los rastreadores de los motores de búsqueda que la página visitada no debe ser indexada. Los webmasters tienen con esta herramienta la posibilidad de manipular el proceso de indexación de sus páginas.

Implementación

La metaetiqueta noindex se incorpora en el código fuente de un sitio web al final dely en la zona de los Metadatos. Aparece del siguiente modo:

<Meta name = “robots” content = “noindex” />

El contenido de esta página no será indexado y por lo tanto no aparecerá en los SERPs.

Para comprobar si la metaetiqueta ha sido leída correctamente por los rastreadores los webmaster pueden llevar a cabo el Comando de Búsqueda site: para esa página en los motores de búsqueda. Si se ha hecho correctamente la página no debería aparecer en los resultados, SERPs.

Aplicaciones

Con el comando noindex los motores de búsqueda excluyen las páginas indicadas y no guardan su información en la base de datos. Esto resulta muy útil para, por ejemplo:

Resultados de búsqueda internos
Contenido / páginas duplicadas
Contenido copyright

Las páginas marcadas por el “noindex” se encuentran en el Deep Web.

Noindex vs. disallow

En muchos casos los webmasters no tienen claro cuál es la diferencia entre los comandos “disallow” del archivo Robots.txt y la metaetiqueta “noindex”. Generalmente hablando no se recomienda utilizar los dos comandos simultáneamente.

La diferencia es básicamente que con el comando “disallow” los motores de búsqueda no tienen permitido acceder a la URL y con el comando “noindex”, estos pueden acceder pero los rastreadores no pueden indexar la página.

Disallow

El contenido no debería ser analizado como:

Contenido sensible como datos de registro
Para volúmenes de datos muy elevados, base de datos de imágenes
Sin embargo, es posible que la página sea indexada.

Noindex

El contenido puede analizarse pero no indexarse
Resultados de búsqueda internos
No entra en el index

noindex,follow

Si lo que se pretende es que un dominio no sea indexado pero que el enlace sí que sea rastreado, se debe utilizar la metaetiqueta noindex,follow:

<Meta name = "robots" content = "noindex, follow" />

Este comando resulta útil para las categorías que contienen muchísimas páginas. El robot puede entrar en el enlace pero puede indexar solo la primera página de cada categoría, por ejemplo.

Relevancia para el SEO

La metaetiqueta ‘noindex’ es una herramienta de SEO muy útil para evitar que el contenido duplicado sea indexado y, por lo tanto, para evitar posibles penalizaciones y consecuente deterioro del posicionamiento. Además, al añadir el comando follow los rastredaores tienen la posibilidad de seguir pero no de indexar las páginas.

Muchos CMS (Sistemas Gestores de Contenidos) crean muchas páginas de forma automática para que sean indexadas rápidamente. En casos extremos este aumento de páginas se considera una técnica spam pero con el comando noindex se puede evitar ser penalizado.

Cuando se lleva a cabo el relanzamiento de un sitio web el comando noindex facilita el trabajo: mientras se comprueba la funcionalidad del nuevo sitio se bloquea su indexación para no crear contenido duplicado.

Siguiente Frontend »

Anterior « Embudo de Conversión - Funnel

7 años hace

App Marketing

Noindex

Implementación

Aplicaciones

Noindex vs. disallow

Disallow

Noindex

noindex,follow

Relevancia para el SEO

TYPO3

Breadcrumb

Google Mobile

Valor Añadido

RankBrain

Ad Exchange

Noindex

Implementación

Aplicaciones

Noindex vs. disallow

Disallow

Noindex

noindex,follow

Relevancia para el SEO

Entrada Relacionada

TYPO3

Breadcrumb

Google Mobile

Valor Añadido

RankBrain

Ad Exchange