10 Pasos para comprobar la indexabilidad de tu web con Ryte

Para cualquier webmaster o responsable de SEO puede ser frustrante vuestro posicionamiento no está mejorando a pesar de tomar grandes medidas de optimización. Pero, es posible que se os haya pasado algo importante. ¿Estás seguro de que Google está indexando tu web?

Aquí es donde Ryte puede ser muy útil: puedes utilizar Ryte como guía paso a paso para encontrar los factores que impiden que tu web se indexe. Una vez que hayas comprobado estos pasos y realizado las correcciones necesarias, nada se interpondrá en el camino para que tu web sea indexada con éxito.

Paso 1: Revisa tus páginas en busca de etiquetas Noindex

Este es un error que puede ocurrir incluso a los más experimentados SEOs: Puede que hayas insertado accidentalmente la metaetiqueta "noindex, follow" en tus subpáginas, u olvidado eliminarla. Esta etiqueta se utiliza para asegurar que una URL no será indexada por los motores de búsqueda, y se inserta en el area <head> de una página web de la siguiente manera:

Esta etiqueta puede ser una forma útil de evitar la duplicación de contenido, y también se puede utilizar, por ejemplo, antes de una transferencia de dominio, para probar el sitio web antes del lanzamiento real. (Aunque cuando tu web entre en funcionamiento, la etiqueta Noindex debería, por supuesto, ser eliminada).

Con Ryte Website Success, puedes comprobar con unos pocos clics qué páginas son indexables. Haz clic en el apartado "Indexabilidad" del informe "URLs indexables".

indexabilityryte1-740x370 Yoast indexación indexabilidad archivo robots.txt

Figura 1: Comprueba tu indexabilidad con Ryte

Paso 2: Comprueba tu archivo Robots.txt

Con el archivo robots.txt, puedes controlar activamente el crawl y la indexación de tu web dando instrucciones específicas a Googlebot sobre los directorios y las URL que debe rastrear.

Sin embargo, al configurar el archivo, es posible que hayas excluido accidentalmente directorios importantes de la rastreabilidad o que hayas bloqueado páginas enteras. Esto no impide directamente que tus URL se indexen, ya que Googlebot puede encontrarlas, rastrearlas e indexarlas a través de backlinks desde otras webs. Sin embargo, con un archivo robots.txt defectuoso, Googlebot no podrá realizar búsquedas en todas las áreas de tu web con suficiente frecuencia. Lee este artículo para averiguar más errores que se pueden cometer al configurar el archivo robots.txt.

Deberías comprobar el archivo robots.txt en busca de errores, especialmente después de realizar cambios. Ryte puede ayudarte aquí: haz clic en el informe "Robots. txt" en la sección "Indexabilidad". Ryte Website Success te proporcionará una lista de todas las URL excluidas del rastreo. Con Ryte, también puedes supervisar el archivo robots.txt para hacer un seguimiento de cualquier cambio.

indexability2-740x228 Yoast indexación indexabilidad archivo robots.txt

Figura 2: Comprueba tu robots.txt con Ryte

Paso 3: Comprueba si hay errores en tu archivo.htaccess

Tu archivo .htaccess también puede impedir que tu página aparezca en los resultados de búsqueda y que se vea rastreada como un acceso no autorizado. El.htaccess es un archivo de control almacenado en un directorio del servidor Apache.

Entre otras cosas, los operadores web las utilizan para las siguientes acciones:

Reescribir una URL.
Redireccionamiento de una URL antigua a una nueva URL.
Redireccionamiento a la versión www de una página.

Las reglas concretas se pueden definir en el .htaccess. Sin embargo, para que estas reglas sean ejecutadas por el servidor, el archivo siempre debe tener el mismo nombre en los siguientes casos:

Redireccionamiento o reescritura de URLs:

RewriteEngine On

La reescritura requiere el uso de:

RewriteBase /

Define la regla que el servidor debe ejecutar:

RewriteEngine On
RewriteBase /
RewriteRule seitea.html seiteb.html [R=301]

Por supuesto, es posible que el archivo haya sido nombrado incorrectamente y por lo tanto no pueda reescribir o redirigir URLs. Como resultado, tanto los usuarios como los motores de búsqueda no podrán acceder a las páginas y, por lo tanto, no serán rastreados ni indexados.

Paso 4: Prueba tus etiquetas canónicas

Una etiqueta Canónica ayuda a Google a encontrar la URL original para varias URL con el mismo contenido, de modo que se pueda indexar la URL correcta. La etiqueta Canonica hace referencia a una etiqueta HTML con un enlace a la página original, la URL "canónica".

Al configurar las etiquetas canónicas, pueden producirse numerosos errores que causan problemas con la indexación.

La etiqueta Canónica se refiere a una ruta lateral relativa.
La etiqueta Canónica se refiere a una URL que se encuentra en la etiqueta Noindex.
Una página paginada se refiere a la primera página de la paginación por etiqueta Canónica.
La etiqueta Canónica se refiere a una URL sin barra.

Cómo comprobar sus etiquetas canónicas con Ryte:

Ryte tiene su propio informe para etiquetas canónicas en el área "Indexabilidad". Después de hacer clic en "Canónicas" y "Uso" obtendrás rápidamente una visión general de los posibles problemas con tus etiquetas canónicas.

indexability3-740x236 Yoast indexación indexabilidad archivo robots.txt

Figura 3: Comprueba etiquetas canónicas con Ryte

Paso 5: Supervisar los mensajes de error de estado y disponibilidad del servidor

Otra razón por la que una web o URL no se puede indexar puede ser debido a un fallo del servidor. Esto hace técnicamente imposible acceder a una página.

Los servidores también juegan un papel importante para la optimización de motores de búsqueda por muchas razones. Para obtener un buen posicionamiento, necesitas un servidor rápido y eficiente. Si es lento, habrá retrasos en el tiempo de carga de tu web que a los usuarios no les gusta, lo que resulta en una alta tasa de rebote y bajo tiempo medio en la página. Google clasifica estos KPIs como negativos para la experiencia del usuario, lo que por supuesto tiene un efecto negativo en el SEO.

Con Ryte Website Success, puedes comprobar regularmente tu servidor; la función de monitorización del servidor te mantiene informado sobre fallos y tiempos de espera para que puedas actuar rápidamente.

indexability4-740x256 Yoast indexación indexabilidad archivo robots.txt

Figura 4: Monitorización del servidor con Ryte

Consejo:

Comprueba regularmente los códigos de estado HTTP de tu web para ver si los redireccionamientos 301 funcionan correctamente o si existen códigos de estado 404. Las páginas con este estado no pueden ser rastreadas por lectores potenciales y rastreadores web. Los enlaces que remiten a estas páginas se denominan „enlaces muertos“.

Paso 6: Buscar páginas huérfanas

Cuando reestructura tu web, o añades nuevas categorías, es posible que estas nuevas páginas no estén vinculadas internamente. Además, si estas nuevas URLs no están listadas en el sitemap.xml y no están enlazadas desde fuentes externas, existe un alto riesgo de que estas páginas no sean indexadas. Por lo tanto, trata de evitar páginas huérfanas a toda costa.

indexability5-740x273 Yoast indexación indexabilidad archivo robots.txt

Figura 5: Buscar páginas sin enlaces entrantes

Ryte Website Success te muestra rápidamente las páginas huérfanas. Para ello, haz clic en el informe "Páginas sin enlaces" en la sección "Enlaces".

Paso 7: Buscar robo de contenido – Contenido duplicado externo

El contenido duplicado externo significa que una página de Internet externa toma el contenido de tu página. A pesar de que Google ha mejorado el tema de saber cual es el "original", es posible que una página con tu contenido esté mejor posicionada que la tuya, o que, en casos extremos, impide que tu contenido sea indexado.

El siguiente consejo te ayudará a evitar el robo de contenido:

Cuando publiques tu contenido, pide una referencia a la fuente original. Al señalar de antemano las condiciones para la transferencia de estos elementos de texto, se evita la duplicación de contenido externo. Los editores pueden utilizar un aviso específico como "texto original en www.tupaginae.com" o pueden establecer una etiqueta canónica en la URL en la que publicó el contenido originalmente.

Para encontrar contenido duplicado externo, puedes simplemente copiar algunas líneas de texto relevantes de tu página e introducirlas en la barra de búsqueda de Google. Si varios resultados con exactamente el mismo contenido aparecen sin un enlace a tu página, es porque obviamente, se está produciendo un robo de contenido.

Paso 8: Identificar los enlaces internos de Nofollow

Si etiquetas tus enlaces internos con el atributo rel="nofollow", Googlebot no seguirá el enlace y estarás impidiendo el rastreo correcto de tu web, como si impidieras que Googlebot siguiera un enlace, es posible que no pueda llegar a áreas más profundas de la página. Por lo tanto, algunas URLs ya no serán rastreadas, lo que significa que la probabilidad de que sean indexadas disminuye.

Si estás trabajando con enlaces internos nofollow, puedes consultar con Ryte dónde encontrarlos. A continuación, recomendamos que elimines el atributo nofollow. Si realmente deseas excluir una URL de la indexación, la etiqueta noindex en combinación con el atributo "follow" es lo más adecuado.

Paso 9: Comprueba tu Sitemap XML

Al crear un sitemap, es posible que éste no contenga todas las URL que se van a indexar. Esto crea un problema similar a las páginas huérfanas, porque no hay enlaces a las URL en cuestión. Si esto sucede, existe un alto riesgo de no indexación.

Ryte Website Success puede ayudarte con esto. En Website Success, en el área "Sitemap", ve al informe "Código de respuesta de los archivos". Allí se le mostrarán todas las URLs del sitemap que no se encuentran en el servidor o que han sido redirigidas.

Yoast indexación indexabilidad archivo robots.txt

Figura 6: Comprueba tu sitemap.xml para ver si hay errores con Ryte

También puedes comprobar si hay errores en el sitemap con la Google Search Console; un aviso de advertencia indica posibles problemas con la indexación.

Paso 10: Comprueba regularmente si tus páginas han sido pirateadas

Google quiere ofrecer a sus usuarios la mejor calidad posible en los resultados de búsqueda. Las páginas cortadas restringen esta calidad de manera masiva. Asegúrate de buscar pistas en la Google Search Console. Si web ha sido víctima de piratería informática, es el momento de mantener la calma. Si es posible, un primer paso sería cambiar las contraseñas para acceder al backend.

Para evitar los hacks, deberías cambiar las contraseñas regularmente y limitar el número de usuarios de contraseñas tanto como sea posible. Además, es importante que siempre instales todas las actualizaciones ofrecidas. Google ofrece más información y consejos sobre la piratería informática en el blog central para webmasters.

Conclusión

Puede haber muchas razones por las que tu web o URLs individuales no están siendo indexadas. Con Ryte,puedes encontrar y resolver fácilmente los errores, lo que conduce a una mejor indexabilidad de tu web que llevará a un mejor posicionamiento y por tanto, más éxito para tu web.

Indexing Checklist

5Disponibilidad del servidor y registros de códigos de estadoMonitoriza la disponibilidad de tu servidor y comprueba los códigos de estado de tus URL.

	Área	Medida
1	Etiquetas Noindex	Comprueba tus URLs para la etiqueta no-index. A menos que esta etiqueta sea completamente necesaria, cámbiala por „index, follow“.
2	Robots.txt	Comprueba el archivo robots.txt y verifica si los directorios importantes están excluidos del rastreo.
3	.htaccess	Comprueba si este archivo contiene redirecciones incorrectas o errores de sintaxis.
4	Etiquetas canónicas	Comprueba que estas etiquetas se refieren correctamente a la URL canónica.
6	Páginas huérfanas	Encuentra páginas sin enlaces entrantes y crea enlaces internos.
7	Contenido robado	Comprueba si webs externas utilizan tu contenido. Crea etiquetas canónicas y evita URLs relativas.
8	Enlaces nofollow internos	Busca etiquetas nofollow en tu web y eliminalas. Las alternativas son las etiquetas canónicas o las etiquetas noindex
9	XML-Sitemap	Comprueba si tu sitemap contiene todas las URL que deben indexarse y comprueba los códigos de estado de las URL.
10	Hacking	Busca avisos sobre páginas pirateadas en la Google Search Console y, por ejemplo, cambia tus datos de acceso.

Comprueba la indexabilidad de tu web con Ryte FREE

¡Empieza ahora!

Escrito el 13.08.2018 por Clara Rubio.

share tweet share share vote

Clara Rubio

Clara es una apasionada del mundo digital y la tecnología. Desde siempre ha estado interesada en en estos campos, llevándolos por bandera en su vida profesional y personal. Como redactora, escribirá sobre numerosos temas, incluyendo las novedades del mundo SEO y de cómo Ryte te ayudará en tu camino al éxito digital.

Categorías Búsqueda Orgánica Características del Producto Eventos de Ryte Experiencia de Usuario Marketing de Contenidos Prácticas de Marketing SEO Técnico Tópicos de Google
Los usuarios de Ryte ganan un 93% de clics después de 1 año.

Optimice su sitio web con Ryte
Demo gratuita