Tipo de Contenido

El tipo de contenido se refiere al contenido de un archivo que se transfiere a través de HTTP y se clasifica según una estructura de dos partes. Esta clasificación está estandarizada y publicada por la IANA (Internet Assigned Numbers Authority, que supervisa la asignación global de direcciones IP). Un término alternativo es MIME. En este caso, el contenido de los datos se especifica según el MIME (Multipurpose Internet Mail Extensions). El tipo de contenido es también una metaetiqueta de un documento HTML que puede mostrar a los navegadores qué contenido se está utilizando en esa página web específica.

Tipos de contenido MIME

Existe una gran variedad de tipos de contenido, que también se denominan tipos MIME. El estándar MIME se introdujo específicamente para los correos electrónicos.

La indicación del tipo de medio de Internet proporciona dos especificaciones y opcionalmente una adicional. El primero incluye el tipo de medio y el segundo la subcategoría. Se pueden utilizar los siguientes tipos de medios:

  • Aplicación: Se trata de ficheros que pueden ser utilizados por una aplicación particular o ficheros para los que no es posible una asignación única.
  • Audio: Se refiere a los archivos de audio contenidos en un documento.
  • Ejemplo: Si un documento está marcado con esto, contiene ejemplos de formatos de fichero específicos.
  • Imagen: Indica los archivos de imágenes y gráficos.
  • Mensaje: Esto especifica mensajes como el correo electrónico.
  • Modelo: Designa datos con estructura multidimensional.
  • Multiparte: Este tipo designa archivos que constan de varias partes.
  • Texto: Este es el tipo de medio de Internet para archivos de texto.
  • Video: Se utiliza para archivos de vídeo.

Las combinaciones comunes con subcategorías son:[1]

  • Imagen/jpeg: Archivo de imagen JPEG
  • Imagen/tiff: Archivo de imagen TIFF
  • Texto/plano: Archivo TXT (Texto Simple)
  • Video/mpeg: Archivos MP2, MPA, MPE, MPEG, MPG
  • Audio/mpeg: archivos MP3
  • Audio/x-wav: archivos wav

Si se está clasificando un documento HTML, también se puede completar el juego de caracteres. Una posible especificación sería por ejemplo: text/html; charset=UTF-8

Tipo de contenido como meta etiqueta

El tipo de contenido meta tag se define en el encabezado de una página web para mostrar el juego de caracteres estándar y el tipo de contenido que se está usando en una página HTML.

Beneficios

Definiendo el tipo de contenido y, en particular, el charset (conjunto de caracteres), se puede garantizar que cualquier navegador pueda visualizar correctamente la página. Si esta especificación no se inserta en el encabezado de una página, es posible que los navegadores no puedan mostrar las diéresis ä, ö y ü o este tipo de caracteres correctamente. Anteriormente se veían a menudo páginas en las que las diéresis se sustituían alternativamente por marcadores de posición variables.

La puntuación especial también puede causar problemas. Al especificar el tipo de contenido, el juego de caracteres que se utilizará se definirá de acuerdo con la norma ISO. Cuando un navegador acceda más tarde a la página, reconocerá a partir de esta especificación qué juego de caracteres debe utilizarse. De esta manera se asegura la correcta interpretación de todos los caracteres.

Ejemplo de integración

La metaetiqueta Tipo de contenido tiene el siguiente aspecto:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

El juego de caracteres de Europa Occidental y América, ISO-8859-1, se aplica a las páginas en castellano.

Otros estándares ISO para webs en idiomas extranjeros

Si las webs se publican en otros idiomas, se aplican normas diferentes:

ISO 8859-1: Albanés, danés, alemán, inglés, feroés, finlandés, francés, gallego, islandés, irlandés, italiano,
catalán, holandés, noruego, portugués, español, sueco.
 
ISO 8859-2: Croata, polaco, rumano, eslovaco, esloveno, checo, húngaro.
 
ISO 8859-3: Esperanto, gallego, maltés, turco (Turco también ISO 8859-9.).
 
ISO 8859-4: Estonio, letón, lituano.
 
ISO 8859-5: Búlgaro, macedonio, ruso, serbio, ucraniano.
 
ISO 8859-6: Árabe
 
ISO 8859-7: Griego moderno.
 
ISO 8859-8: Hebreow.
 
ISO 8859-9: Turco.
 
ISO 8859-10: groenlandés (inuit), sami (sami)

Relevancia para el SEO

Mediante la definición de meta tags se proporcionan información a los motores de búsqueda. Por lo tanto, se recomienda utilizar metatags de tipo contenido. Esta especificación es una de las etiquetas que puede ser fácilmente leída por el motor de búsqueda de Google. Si se establece esta etiqueta, Googlebot puede clasificar por adelantado el contenido crawleado con precisión. Al mismo tiempo, se facilita la asignación a la búsqueda vertical, como la búsqueda de imágenes o vídeos.

El tipo de contenido también es importante para la asignación de idiomas. Si se define el juego de caracteres de Europa Occidental para un sitio web alemám, Google descubre automáticamente que las diéresis ä, ö y ü deben equipararse con ae, oe y ue. Si un usuario busca, por ejemplo, "Linkpopularitaet" (en inglés: link popularity), entonces Google puede generar resultados de búsqueda que contengan la palabra "Linkpopularitaet".

Referencias

  1. Tipos MIME por tipo de contenido About.com. Visitado el 01/04/2014

Enlaces Web