Representación de datos multimedia

El sonido

Para poder captar, codificar y almacenar magnitudes de la naturaleza, como son, por ejemplo, la imagen y el sonido, es necesario que se produzca un proceso de digitalización de esta magnitud.

Una señal puede ser de dos tipos: analógica o digital. El término analógico en la industria de las telecomunicaciones y el cómputo hace referencia a todo aquel proceso de entrada/salida cuyos valores son continuos. Algo continuo es todo aquello que puede tomar una infinidad de valores dentro de un cierto límite, superior e inferior. El término digital, de la misma manera, involucra valores de entrada/salida discretos. Algo discreto es algo que puede sólo tomar valores fijos determinados.

002-ondas

Señales analógica y digital

Mirando este gráfico, el valor correspondiente, por ejemplo, a 8 será el mismo en ambas señales, pero, por ejemplo, el valor de 8,4 no, puesto que la señal digital sólo precisa el de 8 y el de 9. Una señal digital tendrá definida una precisión, que cuanto mayor sea, más se parecerá a la señal analógica, pero siempre perderá un mínimo de información. En la naturaleza las señales son analógicas y las digitalizamos para poder tratarlas electrónicamente. Las señales digitales tienen muchas ventajas:

  • Es mucho más fácil de representar, y por tanto, de procesar.
  • Pueden ser amplificadas y reconstruidas.
  • Cuentan con sistemas de detección y corrección de errores.
  • Se deterioran menos a causa de interferencias.

Toda la tecnología digital (audio, vídeo) está basada en la técnica de muestreo, sampling en inglés. En música, cuando una grabadora digital toma una muestra, básicamente toma una fotografía fija de la forma de onda y la convierte en bits, los cuales pueden ser almacenados y procesados. Una grabación analógica está basada en registros de voltaje con valores proporcionales a la magnitud de la señal. El muestreo digital convierte el voltaje en números (0s y 1s) los cuales pueden ser fácilmente representados y vueltos nuevamente a su forma original.

Tras el muestreo, se realiza la cuantización, que consiste en asignarles un valor a las señales muestreadas. Después se realiza la codificación, donde se representan numéricamente los valores anteriores por medio de códigos y estándares previamente establecidos. Esto permite asignarle valores numéricos binarios equivalentes a los valores de tensiones o voltajes que conforman la señal eléctrica analógica original.

Concretamente, para la representación de audio existen distintos formatos: MP3, WMA, AAC, MIDI, AIFF, etc. Cada uno de ellos tendrá una forma de representación de la información y además, suelen aplicar una compresión, es decir, eliminación de datos, que a veces supone pérdida de calidad. Aparte, es necesario un códec para el proceso de codificación-decodificación de la señal en un formato concreto.

Imágenes

Hemos visto en el apartado anterior como se hace la digitalización de una señal, lo que es válido para la digitalización de imágenes también. Ahora vemos como se codifica la información para guardarlo en un soporte informático.

Una imagen puede representarse como mapa de bits o como mapa de vectores. Como mapa de vectores, la imagen se almacena como un conjunto de objetos que forman parte de ella (líneas, polígonos, textos) mediante vectores y ecuaciones. Esta forma de representar es adecuada para gráficos geométricos y aplicaciones de diseño por ordenador. Ocupan menos espacio e internamente es más sencillo su procesamiento, pero es menos fiel a la realidad, por lo que el tratamiento de fotografías suele hacerse como mapa de bits.

Como mapa de bits, una imagen se guarda como una gran cantidad de pequeños cuadraditos de distintos colores, llamados píxeles. Del número de píxeles que se utilice para guardar una imagen dependerá su resolución y el espacio que ocupa su almacenaje. Es por esto, que utilizamos el tamaño que ocupan las imágenes para referirnos a la resolución que tiene una cámara de fotos (hablamos de megabytes). A mayor tamaño, más píxeles guardará, por tanto más detalle y más resolución.

Cada píxel se codifica mediante un conjunto de bits de longitud determinada. Por ejemplo, puede codificarse un píxel con un byte (8 bits), de manera que cada píxel admite hasta 256 variaciones de color. En las imágenes llamadas de color verdadero, normalmente se usan tres bytes (24 bits) para definir el color de un píxel, es decir, se puede representar un total de 224 colores, esto es 16.777.216 variaciones de color.

Para poder almacenar y procesar la información numérica que se representa de cada píxel, se debe conocer, la profundidad, el brillo del color y el modelo de color que se está utilizando. Por ejemplo, el modelo de color RGB (Red-Green-Blue) permite crear un color compuesto por los tres colores primarios según el sistema de mezcla aditiva. De esta forma, en función de la cantidad de cada uno de ellos que se use en cada píxel será el resultado del color final del mismo. En el modelo RGB lo más frecuente es que se usen 8 bits para representar la proporción de cada una de las tres componentes de color primarias.

Además, es habitual, que a la hora de codificar la información de una imagen en un fichero se produzca una compresión, es decir, en lugar de guardar el detalle de cada píxel, se utilizan técnicas que permiten ahorrar información, suponiendo a veces, pérdida de calidad. Existen muchos formatos distintos en los que codificar imágenes, como son JPEG, GIF, BMP, PNG, etc., cada uno utiliza su forma de representación y compresión propias.

Vídeo

Para la codificación de vídeo se utilizan formatos contenedores al igual que en la codificación de sonido. El vídeo es un conjunto de señales bastante complejo: un conjunto de imágenes, varias pistas de audio, información sobre sincronización, sobre capítulos, sobre subtítulos y meta-datos. Las pistas de audio y vídeo suelen ir comprimidas utilizando formatos relacionados con los que hemos comentado anteriormente. Algunos contenedores multimedia para vídeo son AVI, MPG, ASF o Matroska.

Deja un comentario