Web de Referencia

Una web de referencia es una dirección de Internet o nombre de host utilizado para llevar un visitante a otro sitio web. Un visitante ha hecho clic en un hipervínculo en la web de referencia, que lleva a la web donde se encuentra ahora. La web de referencia es, por lo tanto, la fuente del tráfico en la página actual. Cuando se visita una web, el navegador del visitante transmite el nombre de la web solicitada y también el origen del enlace de referencia que dirigió al visitante a la misma. Las webs de referencia son datos importantes en el análisis web con el fin de asignar tráfico a las diferentes fuentes y averiguar de dónde proceden los visitantes de una web. Los términos referrer, referrals o tráfico de referidos también son comunes además de la web de referidos.

Información general

Cada vez que se accede a una web, el cliente y el servidor se comunican entre sí y transmiten información diversa que se registra en los archivos de registro. Esto incluye, por ejemplo, la dirección IP, los términos de búsqueda y el software utilizado para acceder a la web. Sin embargo, estos archivos de registro también muestran el sitio de referencia si la solicitud se hizo desde otra web. Si un usuario hace clic en un enlace que dirige a la web B desde la web A, el servidor web de B anota la dirección de Internet de A en sus archivos de registro. El suministro de la información del remitente no está permitido sólo en casos excepcionales, por ejemplo, si el navegador no guarda dichos datos por motivos de seguridad, o si la solicitud se ha realizado directamente en la línea URL del navegador o a través de un marcador.

El análisis de las webs y el tráfico en general, plantean diversos problemas desde el punto de vista del análisis web. Por un lado, la web de referencia no siempre se transmite y, por otro, el tráfico puede provenir de fuentes que no son usuarios humanos (spam, bots y servicios de pago). Además, a menudo hay varias referencias y no siempre está claro cuál de ellas desencadenó una compra o una conversión. El primer referenciador es generalmente considerado un disparador, ya que hace que el usuario tenga conocimiento de otra web. Esta es la razón por la que el objetivo del software de análisis es capturar la web de referencia correcta para permitir una evaluación por los webmasters y operadores del sitio. Sin embargo, puede ser necesario realizar ajustes en el software de informes para distinguir entre las fuentes de tráfico.

Cómo funciona

Normalmente, las herramientas de análisis web asocian una conversión a la web que se vio por última vez. Si el usuario concluye una compra en una tienda online, el servidor web de la tienda especificará la web que remitió por última vez al usuario a la tienda online como el remitente. Sin embargo, el comportamiento de navegación y compra de los usuarios no siempre es lineal y pueden ver las tiendas varias veces antes de realizar una compra y el servidor de la tienda puede recibir datos incorrectos o nulos en estas circunstancias. Este problema se resuelve con herramientas de análisis web, por ejemplo, incluyendo las visitas a múltiples webs como parte de las estadísticas y marcando o excluyendo ciertos sitios de referencia como tales. Herramientas como Google Analytics pueden distinguir de forma fiable el tráfico natural del spam, los robots y los servicios de pago cuando se realiza la configuración adecuada (Administrar> Configuración de informes> Filtrar robots).

  • Lista de exclusión de referencias: A nivel de propiedad, ciertos nombres de dominio pueden ser eliminados del tráfico de referencia con la lista de exclusión de referencia. En primer lugar, sin embargo, deben ser identificados. En Adquisición> Todos los Accesos> Referencias, se presentan las sesiones que son consideradas como tráfico de referencia por Google Analytics (GA). Estas fuentes son a menudo reconocibles debido a sus tasas de rebote del 100%. Sin embargo, se recomienda revisar todas las referencias manualmente para evitar la exclusión del tráfico real. Una vez identificadas las referencias responsables de este tipo de tráfico, se pueden separar de los datos analíticos con la lista de exclusión de referencias. Esto se hace en Administrar> Información de seguimiento> Lista de exclusión de referencias. El resultado es que GA trata a todos las webs de referencia de tal manera que no desencadenan nuevas sesiones y ninguna de las sesiones existentes se interrumpe. [1]
  • Crear filtro: Un filtro personalizado también puede excluir referencias. El tipo de filtro Campaign Source tendría que ser seleccionado durante el proceso de creación para entrar en los dominios que representan el tráfico de referencia [2] También es posible utilizar expresiones regulares para seleccionar todas las fuentes de referencia conocidas y no deseadas a través del filtro de texto. Con este fin, todos las webs de referencia no deseadas también serían identificados y luego añadidos a GA por RegEx. Las expresiones regulares se pueden observar en el campo "Filter pattern". La sintaxis es:
paypal\.com|spamsite\.com|.*spamsubdomain\.com

El símbolo (|) se usa para distinguir los dominios y la barra evita que los puntos sean considerados como expresiones regulares. No se debe usar ninguna linea al final de una expresión regular, de lo contrario se excluirán todas las referencias. [3]

  • Personalización de htaccess: El archivo htaccess se puede utilizar para excluir direcciones IP y rangos de IP completos. El archivo htaccess se encuentra en el directorio raíz del servidor web y se puede editar con un editor de texto. Se recomienda realizar una copia de seguridad si los cambios provocan un comportamiento no deseado del servidor. La sintaxis es
order allow,deny allow from all deny from 84.133.115.37

Cualquier otra dirección IP o nombre de host se adjunta con el comando deny desde abajo. El servidor bloqueará posteriormente las IP y los nombres de host correspondientes, y el software de análisis ya no podrá capturar estas referencias. Hay otras opciones, que sólo se mencionan aquí brevemente: la exclusión a través de PHP, NGINX, así como el control de visitantes en Google Tag Manager y, por último, pero no por ello menos importante, las agrupaciones de canales en Google Analytics. Cada enfoque tiene ventajas y desventajas y debe adaptarse a los requisitos de la web (por ejemplo, tiendas online, comercio electrónico u otros tipos de webs) y su herramienta de análisis web o configuración del servidor.

Relevancia para el análisis web

La limpieza de informes en Google Analytics es recomendada por muchos expertos, pero sólo es apropiada en ciertos casos. Es de gran importancia, especialmente en el comercio electrónico, poder registrar las webs de referencia iniciales y excluir las referencias no deseadas, como el spam o los bots. La razón es que estas referencias pueden afectar a los datos de ventas de los informes. El tráfico de referencia puede ser visto como responsable de ciertas ventas, si no está excluido. En consecuencia, se desplazan las representaciones y la asignación a las fuentes desde las que se originó este tráfico. Por lo tanto, las Webs que se supone que generan valores monetarios dependen del hecho de que estos valores se puedan asignar correctamente. De lo contrario, los informes no son exactos y pueden dar lugar a decisiones incorrectas.

Otra razón para excluir las referencias también puede ser que se utilicen métodos similares al spam para guiar a los webmasters a webs que utilizan los enlaces para tácticas de marketing. Este método de "black-hat" no puede ser prevenido, pero el impacto en tu propia web y la creación de informes puede ser prevenido.

Referencias

  1. Excluir fuentes de referencia Support.google.com. Visitado el 07/12/2016
  2. Crear y administrar filtros de vista support. google.com. Visitado el 07/12/2016
  3. Filtrar referencias de dominio support.google.com. Visitado el 07/12/2016

Enlaces Web