TF*IDF

Con la fórmula TF*IDF puedes analizar la importancia que tienen ciertas palabras de un texto o de un sitio web en comparación con todos los documentos disponibles. Esta fórmula se usa no solo para el cálculo de la densidad de las palabras clave sino también, para la Optimización OnPage: aumentar la relevancia de un sitio web en los motores de búsqueda.

TF[editar]

Las siglas TF provienen de la expresión en inglés Term Frequency, Frecuencia de término en español, y determina la frecuencia relativa de un término específico, una palabra o una combinación de palabras, en un documento. Este valor se compara con la frecuencia relativa de todos los demás términos de un texto, documento o sitio web. La fórmula se compone por un logaritmo y se escribe del siguiente modo:

Formelbild1b.png

El logaritmo evita que un aumento sustancial del uso de la palabra clave específica no afecte al valor final del cálculo. Mientras la densidad de una palabra clave calcula solo el porcentaje de distribución de una palabra comparado con el número total de palabras en un texto, la frecuencia de término, TF, contempla también la proporción de todas las palabras usadas en el texto.

IDF[editar]

El término IDF proviene del inglés Inverse Document Frequency y significa Frecuencia Inversa de Documento. Esta segunda parte de la fórmula completa el análisis de evaluación de los términos y actúa como el corrector del TF. La Frecuencia Inversa de Documento es muy importante ya que incluye en el cálculo la frecuencia de documento de términos específicos: compara el número de todos los documentos disponibles con el número de documentos que contienen el término. Y para finalizar, el logaritmo se encarga de comprimir los resultados:

Formel1aaa.png

En resumen: el IDF determina la relevancia de un texto con respecto a una palabra clave específica.

Las fórmulas anteriores calculan la relevancia de un documento en comparación con los demás documentos que contienen esa misma palabra clave. Para obtener resultados útiles, la fórmula debe calcularse para todas las palabras relevantes de un texto.

Cuanto mayor sea la base de datos usada para el cálculo del valor TF*IDF, más preciso será el resultado.

Relevancia para el SEO[editar]

Cuando se habla del TF*IDF aplicado al SEO, los usuarios de herramientas SEO buscan la creación de textos únicos para mejorar el posicionamiento del sitio web en los resultados de búsqueda. Hasta ahora, la densidad de término se ha usado como único referente para la optimización de textos, sin embargo, la fórmula TF*IDF ofrece un modo mucho más preciso de optimizar el contenido.

Dado que los motores de búsqueda analizan la relación semántica entre los términos es muy importante optimizar semánticamente el contenido del sitio web. Este proceso se llama Indexación de la Semántica Latente.

La herramienta TF*IDF determina las palabras clave que deberías utilizar para crear un contenido único para tu sitio web. Esta herramienta no solo optimiza tus textos en relación a una palabra clave, sino también te aporta los términos que te ayudarán a crear un texto verdaderamente único.

Desventajas de la herramienta TF*IDF[editar]

Para optimizar tu contenido con al análisis de la Frecuencia de Término, deberás asegurarte de incluir todos los elementos que componen tu sitio web: los títulos de las categorías y las descripciones de producto son muy importantes.

Para tiendas online con solo un producto en la web, la fórmula TF*IDF no es la más adecuada ya que este tipo de optimización OnPage requiere mucho texto. Esto se debe a que esta fórmula es muy potente y calcula el valor de cada término que se encuentra en el documento.

Para finalizar, la fórmula TF*IDF no contempla la posibilidad de que los términos aparezcan agrupados, que se apliquen normas de lexema o que se usen sinónimos.

Enlaces[editar]

Nuestra innovadora función: TF*IDF Ryte Magazine