El Crawl Budget o presupuesto de rastreo se define como el número máximo de páginas que Google rastrea en un sitio web.
El propio Google define cuántas subpáginas rastrea por URL. Esto no es lo mismo para todos los sitios web, pero según Matt Cutts, se determina principalmente en base al PageRank de una página. Cuanto más alto sea el PageRank, mayor será el Crawl Budget. El presupuesto de rastreo también determina con qué frecuencia se rastrean las páginas más importantes de una web y con qué frecuencia se ejecuta un crawl en profundidad.
El término presupuesto índice (index budget) es diferente de un crawl budget. Determina cuántas URLs se pueden indexar. La diferencia se hace evidente cuando una web contiene varias páginas que devuelven un código de error 404. Cada página solicitada cuenta con el crawl budget, pero si no se puede indexar debido a un mensaje de error, el presupuesto de índice no se utiliza en su totalidad.
El crawl budget o presupuesto de rastreo plantea un problema para webs más grandes con muchas subpáginas. Específicamente, no se rastrearán o crawlearán todas las subpáginas, sino sólo una parte de ellas. Por consiguiente, no todas las subpáginas pueden ser indexadas. Esto a su vez significa que los operadores del sitio pueden perder tráfico porque las páginas relevantes no fueron indexadas.
Hay toda una sección de optimización de motores de búsqueda dedicada específicamente a esta situación, con el objetivo de dirigir el Googlebot, de modo que los crawl budgets existentes se utilizan muy sabiamente y las páginas de alta calidad que son de particular importancia para el operador del sitio web se indexan. Las páginas que son de menor importancia deben ser identificadas primero. En particular, esto incluiría páginas con contenido pobre o poca información, además de páginas defectuosas que devuelven un código de error 404. Estas páginas deben excluirse del crawl para que el presupuesto de rastreo permanezca disponible para las páginas de mejor calidad. Posteriormente, las subpáginas importantes deben ser diseñadas de tal manera que sean crawleadas por las arañas como una prioridad. Las posibles acciones como parte de la optimización del crawl incluyen:
Si el portfolio de páginas rastreadas e indexadas se mejora a través de la optimización de crawl, también se puede mejorar el posicionamiento. Las páginas con una buena clasificación se rastrean con más frecuencia, lo que a su vez trae beneficios.
Breadcrumb es una navegación secundaria dentro de una web (también llamada navegación de miga de…
Google Mobile hace referencia a todos los productos y servicios ofrecidos por Google Inc. con…
El término valor añadido (added value en inglés), tiene su origen en la administración de…
RankBrain es un nuevo subsistema de algoritmos que Google utiliza en la entrega de resultados…
El término ad exchange (intercambio de anuncios) se refiere a los mercados online, en los…
Esta web usa cookies.