Indexación

Generalmente, la indexación' se refiere a un método de adquisición de información (desarrollo de información), mediante el cual los documentos se recopilan y clasifican en función de palabras clave. Posteriormente, se forma un índice que es similar a una biblioteca. Los documentos indexados, en su mayoría contenido de texto, se preparan para una búsqueda de un documento específico o palabra clave y se les proporcionan descriptores.

Si buscas una palabra clave y los documentos relacionados, lo ideal es que se muestre el contenido más relevante. En una biblioteca, los descriptores pueden ser datos como los números de autor, título o ISBN. En principio, lo mismo sucede con una consulta en Internet. En otras palabras, el término indexación denota la formación de un índice en el que los documentos web se recogen y clasifican utilizando varios descriptores (tales como palabras clave) y se ponen a disposición para búsquedas posteriores (recuperación de información).

Información general

La indexación de documentos web es un proceso extenso y complejo, que utiliza varios métodos de ciencias de la información, informática y lingüística de ordenadores. Además del desarrollo de información (explicado anteriormente) y la recuperación de información, otro término importante es la minería de datos, que es la clasificación de contenido valioso a partir de una gran cantidad de datos.

Varios procesos asociados con la indexación ocurren antes de que se introduzca un término de búsqueda. Los documentos web deben ser buscados y analizados (ver Crawlers, Spiders, Bots). Estos son recopilados, ordenados y jerarquizados en un índice antes de que puedan ser mostrados en los SERPs de los motores de búsqueda en una secuencia particular. Los proveedores de motores de búsqueda como Google, Yahoo o Bing trabajan constantemente para mejorar la indexación de los sitios web para proporcionar el contenido más relevante.

Google ha cambiado recientemente su índice e introducido el Índice de Cafeína. Se supone que debe incluir contenido web más rápidamente en el índice mediante la búsqueda constante y sincrónica de ciertas partes de la Internet global. Además, se supone que el contenido web, como vídeos o podcasts, se puede encontrar más fácilmente^[1].

Relevancia práctica

Diferentes consecuencias y posibilidades surgen para los operadores del sitio y los webmasters con respecto a la indexación. Si una página web va a ser indexada y se encuentra en el índice, primero debe estar disponible para el crawler o araña. Si se trata de una web nueva, se puede enviar al motor de búsqueda para ser incluido en el índice registrándolo. La web debe ser localizable por el crawler y legible hasta cierto punto.

Las meta etiquetas, que se pueden listar en la sección de cabecera de una página web, son una forma de asegurar esto. También se pueden utilizar para suprimir el acceso de los rastreadores con el fin de excluir una página en particular del índice. Las etiquetas canónicas y otras etiquetas del archivo robots.txt también se pueden utilizar con este fin. El estado de indexación se puede recuperar en la Google Search Console. Las URL que ya se encuentran en el índice se muestran en las pestañas Índice de Google y Estado de indexación. Esto incluye aquellos que han sido bloqueados por el operador del sitio.

Indexación y SEO

La indexación es muy importante para el SEO. Los webmasters y operadores web pueden controlar este proceso desde el principio y asegurar que las páginas web sean rastreadas, indexadas y luego mostradas en los SERPs. Sin embargo, su posición en los SERPs sólo puede ser influenciada con varias medidas OnPage y OffPage y la provisión de contenido de alta calidad.

También debes mantenerte al día, ya que Google modifica sus algoritmos con bastante regularidad para excluir del índice los sitios de spam o las redes de enlaces.

Referencias

↑ Nuestro nuevo índice de búsqueda: Caffeine. googleblog.blogspot.de. Visitado el 02/07/2014

Enlaces Web

Matt Cuts sobre la Indexación y el Crawl en una entrada de vídeo

[1] Nuestro nuevo índice de búsqueda: Caffeine. googleblog.blogspot.de. Visitado el 02/07/2014

[1]