Si navegas regularmente por Internet, te darás cuenta de que no todas las webs funcionan correctamente. Es común encontrarse con mensajes de error 404, ya que el servidor emite un código de estado 404 si no se encuentran las páginas.
Los errores 403 son menos comunes, pero también son posibles. Éstos se producen cuando un cliente accede a un recurso para el que no tiene autorización. En este artículo, explicamos qué causa un código de error 403, qué consecuencias puede tener, y qué se puede hacer al respecto.
Si un cliente, como un navegador, desea recuperar una URL de un servidor a través de http, el servidor primero verifica esta petición. Si la página existe y se puede mostrar, el servidor envía el código de estado 200 OK. El navegador puede entonces cargar el sitio web y mostrárselo al usuario. Esta "transacción" entre el cliente y el servidor suele pasar desapercibida para los usuarios, a menos que se produzcan errores.
Los errores más comunes encontrarás son errores 4xx - estos pertenecen a una clase conocida como errores de cliente. El error 403, al igual que el código de error 404, es uno de ellos. Ahora, si un navegador se conecta a un servidor a través de http, el servidor puede denegar el acceso. En este caso, el servidor devolverá el código 403 y el navegador no podrá acceder al recurso deseado.
Figura 1: Notificación desde el servidor cuando se intenta acceder a una página de administración de un blog de WordPress.
Incluso si el código de error 403 inicialmente sugiere un error de cliente, en última instancia se debe a la configuración del servidor o la configuración del CMS respectivo, si un cliente tiene acceso a ciertos directorios o URLs o no.
Si las URLs no pueden ser mostradas por los navegadores, no tienen valor añadido para los visitantes de la web. Un error 403 inevitablemente conduce a una experiencia de usuario negativa y limita significativamente la usabilidad de tu web. Como resultado, es posible que tu sitio no sea visitado de manera recurrente si se producen errores 403 con frecuencia.
Desde el punto de vista del motor de búsqueda, un error 403 también es un problema porque Googlebot no puede rastrear el contenido de las URL en cuestión y renderizarlas como un navegador. Por lo tanto, existe el riesgo de que las páginas se eliminen del índice de Google.
En 2014, Matt Cutts concedió un período de gracia de 24 horas por si el Googlebot había encontrado una página 403. Según Cutts, ese es el tiempo que el sistema permitió que la URL permaneciera en el sistema de rastreo.
En una ronda de preguntas sobre SEO en Reddit, John Mueller de Google también comentó sobre el tema de los errores 4xx. Allí, los consejos se hicieron más específicos:
Figura 2: Declaración de John Mueller sobre errores 4xx. (Fuente)
Así que una cosa está clara: si una URL no entrega contenido para una solicitud de cliente, incluso una solicitud de Googlebot, se eliminará del índice.
Hay varias razones por las que una web puede devolver un error 403. En muchos casos, el se establece deliberadamente un bloqueo de acceso y esto a menudo tiene sentido:
Además de esta restricción significativa, los usuarios pueden ser excluidos si los directorios son bloqueados involuntariamente. Esto puede suceder en los siguientes casos:
Los errores 403 también pueden darse para los robots cuando intentan rastrear tu sitio. Por ejemplo, si a Googlebot no se le permite buscar en directorios importantes debido a los valores predeterminados de robots.txt, que son importantes para la funcionalidad de tu web, es posible que se produzca este tipo de error. "Los errores de "Forbidden” (Prohibido) también son posibles si utilizas robots.txt para excluir los directorios centrales con contenido de ser rastreados.
Ryte puede ayudarte a identificar errores 4XX. La manera más rápida para encontrarlos, es haciendo clic en el informe “Errores Críticos” del Dashboard de Ryte.
Además, puedes usar la herramienta Website Success de Ryte para comprobar los códigos estado de tu web. Ten en cuenta la fecha en la que tu web ha sido crawleada por última vez.
Figura 3: Comprueba los códigos de estado de una web con Ryte Website Success.
La Consola de Búsqueda de Google (GSC) también te mostrará si hay 403 errores. Puedes encontrar el informe correspondiente en la sección "Errores de rastreo":
Figura 4: Determinación de errores de rastreo con la GSC.
Si a los clientes se les niega el acceso a los directorios o URL de tu web, debes tomar medidas.
Figura 5: Comprobar robots.txt con Ryte.
La Google Search Console también es adecuada para comprobar robots.txt. Puedes encontrar el informe en el apartado "Crawl" en la versión antigua de la GSC.
Figura 6: Probar robots.txt con GSC
Con la herramienta "Explorar como Google", puedes comprobar si Googlebot no puede rastrear áreas importantes debido a restricciones en el archivo robots.txt.
Los errores 403 son, en primer lugar, errores del cliente, pero también se deben a una configuración incorrecta del servidor o del archivo robots.txt. Si tienes errores 403 en tu sitio, debes actuar con rapidez; de lo contrario, Google desindexará las URL, ya que no proporcionan contenido y son negativas para la experiencia del usuario.
Encuentra y corrige tus errores 403 con Ryte FREE
Escrito el 08.10.2018 por Clara Rubio.
Clara es una apasionada del mundo digital y la tecnología. Desde siempre ha estado interesada en en estos campos, llevándolos por bandera en su vida profesional y personal. Como redactora, escribirá sobre numerosos temas, incluyendo las novedades del mundo SEO y de cómo Ryte te ayudará en tu camino al éxito digital.
Optimice su sitio web con Ryte
Demo gratuita