HTTP

El HTTP (Hyper Text Transfer Protocol) es un protocolo que se utiliza para transmitir datos en redes. HTTP es un estándar técnico generalmente aceptado que define cómo un cliente web se comunica con un servidor para que los datos solicitados por el cliente puedan ser cargados y mostrados.

Información general

Junto con el URL y el HTML, HTTP es uno de los conceptos más importantes de Internet (www). Fue desarrollado a principios de los noventa y existe ahora en su versión actual 1.1, que está registrada en el estándar RFC2616 [1]

El protocolo define dos tipos diferentes de mensajes, la solicitud del cliente y la respuesta del servidor al cliente. Cada uno de estos mensajes consta de dos partes, la cabecera HTTP y el cuerpo HTTP. La cabecera contiene metadatos sobre el cuerpo del mensaje, como los caracteres utilizados (codificación) y el tipo de contenido (por ejemplo, documento HTML). El cuerpo HTTP contiene los datos que se mostrarán más tarde al cliente.

El protocolo TCP/IP se utiliza para transferir estos datos de forma fiable entre el servidor y el cliente. Actúa como una capa de transporte de host a host. Los datos en Internet se estructuran según un modelo de siete capas (modelo OSI), en el que el protocolo HTTP se utiliza sólo en las tres últimas capas (aplicación, presentación y sesión).

Funciones

Cuando un cliente envía una solicitud TCP para un documento desde una dirección de Internet (URL), el servidor responde con una respuesta que siempre incluye un código de estado HTTP. El código de estado proporciona información sobre si la solicitud se ha realizado correctamente o no y envía un código de tres dígitos en la cabecera HTTP al cliente. Si no se ha encontrado un recurso solicitado, se puede emitir, por ejemplo, el código de error 404.

Sin embargo, el protocolo HTTP no sólo se utiliza para la transmisión de recursos HTML, sino que también se puede utilizar para transportar otros formatos de datos cuando se integran a través de interfaces. El recurso ni siquiera tiene que estar en el servidor. Las páginas web dinámicas pueden ser creadas con PHP o ASP.NET cuando son llamadas por el cliente. Dado que HTTP es un protocolo abierto orientado a objetos, se pueden implementar fácilmente otros tipos de datos. Pero HTTP es un protocolo sin estado. Esto significa que no se almacenarán sesiones ni ID de sesión como parte de la comunicación entre el cliente y el servidor. Esto sólo ocurre en el cliente web o en el navegador del usuario, por ejemplo, con una cookie HTTP.

Las funciones clave del protocolo HTTP son los procedimientos de solicitud. Regulan la transmisión de los datos reales. Usando HTTP GET, el método más comúnmente usado, los archivos, por ejemplo, pueden ser descargados desde el servidor. Enviando un URI (Uniform Resource Identifier), que es un único identificador, al servidor, podrá identificar qué recurso tiene que devolver. Desde la perspectiva del usuario, esto se hace accediendo a un enlace o URL. El servidor o host devolverá el documento solicitado junto con un código de estado al cliente web.

En principio, todos los ordenadores o redes involucradas, pueden seguir la comunicación entre cliente y servidor que tiene lugar a través de HTTP. Por lo tanto, se desarrolló HTTPS. Un protocolo que permite el cifrado y la autenticación para proteger los datos transmitidos contra el acceso de terceros.

Relevancia para la optimización de motores de búsqueda

El protocolo HTTP y los detalles técnicos relacionados son importantes para la el SEO porque los rastreadores de los motores de búsqueda confían en HTTP para acceder a los sitios web. Un crawler actúa como agente de usuario o cliente web cuando busca sitios web y contenido en una página, e inicialmente envía una solicitud al servidor utilizando procedimientos de solicitud.

Dependiendo del modelo de servidor, los webmasters tienen diferentes opciones disponibles para configurar el servidor para que el crawler tenga acceso. Los ajustes básicos se pueden realizar en el archivo robots.txt y un archivo.htaccess almacenado en el servidor puede especificar estos ajustes. Incluso los módulo, como mod-rewrite en los servidores Apache, pueden ser usados junto con el archivo.htaccess para hacer los ajustes apropiados.

En particular, debe evitarse la emisión de códigos de error, ya que los motores de búsqueda no pueden rastrear estas páginas y, en consecuencia, te darán una mala calificación. En el caso de URLs dinámicas, sería recomendable reescribirlas en URLs estáticas. Esto se puede lograr a través de redirecciones en htaccess o circunloquios como mod-rewrite en servidores Apache. Deberían elegirse redirecciones permanentes (301) para transmitir la popularidad de los enlaces.[2]

Referencias

  1. HTTP/1.1. ietf.org. Visitado el 10/12/2013
  2. Redirection. Moz.com. Accessed on 12/10/2013

Enlaces Web