Análisis de Cluster

Un análisis de cluster o análisis de grupos es un método de agrupamiento estadístico utilizado para analizar grandes cantidades de datos. Aquí, los objetos bajo revisión se dividen en diferentes grupos (clusters) y se comparan en base a características específicas. El objetivo de este análisis es crear grupos homogéneos a partir de objetos individuales heterogéneos. Hoy en día, el análisis de cluster es una parte común del marketing y se utiliza, entre otras cosas, como base para las medidas publicitarias.

Métodos[editar]

La agrupación o "clustering" se ha utilizado ampliamente desde la década de 1990 en diferentes campos científicos para segmentar grupos. Implica definir los objetos de estudio individuales como un solo grupo.

En un segundo paso, se combinan diferentes clusters con la mayor similitud para formar un grupo más grande. El siguiente paso del análisis consiste en determinar las distancias entre los grupos individuales para crear clusters aún más grandes. El resultado final es un grupo enorme.

Para los investigadores de mercado, sin embargo, no sólo el mega cluster es de gran importancia. Las intersecciones entre los segmentos individuales también son cruciales.

Hay cinco métodos comunes que se utilizan para calcular la distancia entre dos grupos o entre un grupo y un objeto. Estos son:

Vinculación (entre grupos)[editar]

En estos métodos, se crean pares en los que cada uno de los elementos individuales tiene un objeto en dos grupos diferentes. A continuación se determinan las distancias entre un par y los otros pares. La distancia entre los dos grupos se calcula a partir de la media aritmética de todas las distancias entre todos los pares.

Vinculación (dentro de los grupos)[editar]

Este método consiste en crear pares que presenten similitudes en el mismo cluster y luego calcular la distancia entre ellos. La media aritmética de todas las distancias examinadas se toma al calcular las distancias entre los grupos.

Vecino más cercano o más lejano[editar]

Aquí, se identifica un par de dos grupos que tienen la distancia más corta o más grande entre ellos. La distancia calculada se utiliza para determinar la distancia entre los dos grupos.

Método Ward[editar]

En este método, primero se deben calcular los valores medios de las variables de un nuevo cluster. Las distancias de todos los objetos individuales se suman a estos valores medios, después de lo cual todos estos objetos se colocan en un nuevo cluster cuyo incremento es menor en comparación con la suma.

Agrupamiento de centroides[editar]

En este método, se determina primero la media aritmética de todos los objetos de un cluster. La distancia entre dos clusters se determina comparando las dos cifras obtenidas.

Requisitos[editar]

Se deben cumplir algunos requisitos para realizar un análisis de cluster.

  • deben identificarse en primer lugar las características (variables) que deben utilizarse como base para la comparación.
  • se utilizarán datos normalizados para la comparación con otros datos.
  • los valores atípicos, es decir, los objetos que presentan valores extremos, deben excluirse de las comparaciones.
  • las variables que son demasiado similares deben evitarse ya que pueden falsificar el resultado final.
  • deben evitarse los valores de salida demasiado constantes, ya que pueden complicar la evaluación posterior.

Importancia para el marketing[editar]

El análisis de cluster tiene muchos beneficios en la investigación de mercado. Estos incluyen

  • alta selectividad de los clusters individuales a través de una gran heterogeneidad entre los grupos.
  • caracterización selectiva de clusters individuales a través de la máxima homogeneidad: ayuda a reducir las pérdidas por divergencia en medidas de comercialización posteriores.
  • transferencia simple del clúster a diferentes variables: los grupos objetivo pueden ser fácilmente determinados por diferentes compañías a través de un análisis de clúster.
  • permite la evaluación de los datos existentes.
  • mínimo gasto de personal.
*bajos costes.