Página Huérfana

En el campo del SEO, las páginas huérfanas se refieren a páginas que han perdido referencia a otras páginas de un dominio. Estas páginas por lo general no contienen enlaces internos entrantes y no pueden ser rastreadas por los robots de los motores de búsqueda. Debido a las referencias que faltan, simplemente no se notan.

Información general

La WWW consiste en realidad en sitios web que están enlazados entre sí. Los hipervínculos o referencias dirigen al usuario y a los motores de búsqueda a otras páginas de la web. La idea básica es que el contenido está enlazado entre sí y se puede acceder a él a través de referencias. Las páginas huérfanas no forman parte de esta web, pero surgen cuando se cambia el contenido antiguo y desaparecen por ello de la red web.

Relevancia práctica

Las páginas huérfanas pueden darse en diferentes situaciones. Probablemente la situación más común es cuando se ha generado un error durante el diseño web, como por ejemplo para relanzar una página o crear nuevos contenidos. Un eslabón perdido o un eslabón defectuoso a una página lo hace inalcanzable para los motores de búsqueda.

Los usuarios pueden introducir la URL directamente en la línea de dirección del navegador web, pero en este caso, tienen que saber la dirección exacta. Por esta razón, las páginas huérfanas a menudo se diseñan como páginas de prueba para probar contenido específico o diseños dentro de un grupo particular de usuarios sin que los motores de búsqueda puedan rastrear estas páginas. La tercera aplicación es que las páginas huérfanas se utilizan como páginas de entrada porque no tienen enlaces entrantes, pero pueden proporcionar enlaces salientes sin backlinks. En este caso, sirven como página de entrada para otras páginas o contenido. Un bot de búsqueda no será capaz de encontrar este contenido, por lo que deben evitarse desde una perspectiva de SEO. También suelen violar las políticas de Google.

Las páginas huérfanas también se distinguen de los sitios web sin salida. Las páginas sin salida no contienen enlaces salientes y no conducen a otros contenidos. Tanto los usuarios como los robots de búsqueda no tienen forma de salir de la página a través de un enlace saliente. El caso típico de una página sin salida es un error 404, que absolutamente debe evitarse o requiere manipulaciones especiales desde una perspectiva de SEO.

Relevancia para el SEO

Las páginas huérfanas no son beneficiosas para las páginas web porque el principio de rastreo de un motor de búsqueda se basa en los siguientes hipervínculos. Si una página no contiene enlaces entrantes internos o externos, la página no está en la estructura de árbol de una construcción HTML y está aislada de otras páginas. En este punto, el bot del motor de búsqueda debe detenerse y rastrear una parte diferente de la web. Puede suceder que los robots de los motores de búsqueda no puedan capturar todas las páginas debido a las páginas huérfanas, ya que se pierde repetidamente en las URL y tiene que abortar la búsqueda.

Las páginas huérfanas también pueden incluir páginas que tienen muy pocos enlaces entrantes, que a su vez proceden de páginas parcial o totalmente huérfanas. En general, la estructura de enlaces de una página debe ser distribuida uniformemente para pasar el Linkjuice internamente a las páginas importantes y proporcionar una buena experiencia de usuario.

Las páginas huérfanas se pueden identificar con diferentes métodos. Solo necesitas una lista de todas las URL de un dominio y compararla con una lista de URL rastreadas. Diferentes proveedores de servicios, entre los que se incluye Google, proporcionan herramientas especiales que funcionan como un rastreador. El crawler LYNX basado en texto es un ejemplo de esto. El cotejo de las URL rastreadas con todas las URL existentes debe realizarse manualmente o exportando los datos[1].

Referencias

  1. ¿Cómo identificar las páginas huérfanas?. moz.com. Visitado el 29/03/2014

EnlacesWeb