Tipos de Archivos de Audio

Vicente Frías
By -
7 minute read
0

Una vez digitalizado el audio, por ejemplo la toma de voz de un locutor de radio, se genera un archivo que es susceptible de manipulación con la ayuda de programas especializados. También podremos transformar su contenido sin que la calidad se degrade lo más mínimo. En un archivo de sonido distinguimos entre la cabecera (o header) y los datos.

Un aspecto imprescindible de un archivo de sonido es conocer qué cantidad de datos se grabarán ya que el almacenamiento disponible no es ilimitado. Podemos calcular que cantidad de memoria se hará necesaria para almacenar un segundo de audio digital. Considerando que por ejemplo la frecuencia de muestreo sea de 48 Khz y la resolución sea de 16 bits, tendremos en un segundo 48.000 palabras digitales cada una de 16 bits, o sea 48.000 x 16 = 768.000 bits/seg. por canal. Por ello un canal estéreo necesitará el doble de almacenamiento. Para almacenar una hora de un canal de audio digital son necesarias al menos 330 Mbytes, sin contar con los necesarios para la corrección de errores.


El tamaño de almacenamiento dependerá de la cantidad de canales que tenga el archivo, de la resolución (tasa de muestreo y profundidad) y del tipo de formato empleado.

La limitación de almacenamiento de datos supuso un problema en la grabación de audio digital que se resolvió con la aparición de sistemas de grabación que permitían una compresión de los datos grabados. Por ello existen formatos de archivo de audio digital, que s  pueden dividir en dos categorías PCM sin comprimir y comprimidos. El tamaño puede depender de la cantidad de canales que tenga el archivo y de la resolución (tasa de muestreo y profundidad).

FORMATOS SIN COMPRIMIR

Los formatos sin comprimir se denominan Formatos PCM y contienen toda la información que salió del convertidor analógico a digital, sin ninguna omisión y por eso, tienen la mejor calidad. Dentro de esta categoría se encuentran los formatos WAV, AIFF, SU, AU y RAW. La diferencia principal que tienen estos formatos es el encabezado, alrededor de 1000 bytes al comienzo del archivo.

Wav

Waveform audio format, es un formato de audio digital sin compresión de datos desarrollado y propiedad de Microsoft y de IBM que se utiliza para almacenar audio en un PC. Admite archivos mono y estéreo a diversas resoluciones y velocidades de muestreo, su extensión es .wav.

Es una variante del formato RIFF (Resource Interchange File Format, formato de fichero para intercambio de recursos), método para almacenamiento en "paquetes", y relativamente parecido al formato AIFF usado por Mac.

Puede soportar casi cualquier códec de audio, aunque se utiliza principalmente con el formato PCM (no comprimido) y al no tener pérdida de calidad puede ser usado por profesionales, para tener calidad broadcast. Para crear un CD se necesita que el sonido se grabe a 44100 Hz y a 16 bits, por cada minuto de grabación de sonido se consumen unos 10 Megabytes. Una de sus grandes limitaciones es que solo se puede grabar un archivo de hasta 4 gigabytes, que equivale aproximadamente a 6,6 horas en calidad CD. Se debe a que en la cabecera del fichero se indica la longitud del mismo con un número entero de 32 bit, lo que limita el tamaño del fichero a 4 GB. No es usado en internet porque los archivos sin compresión son muy grandes.

Wave Broadcast

AES31/Broadcast Wave es una variante del estándar de audio WAV. El formato AES31  contiene registros de Código de Tiempo SMPTE y otra información, además de los datos de audio PCM sin procesar (en bruto). Esta variante cumple los estándares de EBU (European  Broadcasters Union) y AES (Audio Engineering Society). Es recomendable esta opción  para garantizar la compatibilidad con sistemas de sonido profesionales.

AIFF 

Formato de Archivo de Intercambio de Audio (Audio Interchange File Format) es un estándar de formato de audio usado en plataformas Mac. El formato fue co-desarrollado por Apple en 1988 basado en el IFF (Interchange File Format). Los datos de audio en el estándar AIFF no están comprimidos, y emplea una modulación (PCM). Las extensiones de archivo para el formato estándar AIFF es .aiff o .aif. AIFF es uno de los formatos líderes, junto a SDII y WAV, usados a nivel profesional para aplicaciones de audio ya que está comprimido sin pérdida. El estándar da soporte a bucles para notas musicales para uso de aplicaciones musicales o samplers.

FORMATOS DE AUDIO COMPRIMIDOS

Para usar menos memoria que los archivos PCM existen formatos de sonido comprimidos, como por ejemplo el MP3, AAC y Ogg. Para reducir la información se emplean algoritmos de compresión que descartan información que no es perceptible por el oído humano para lograr que el mismo fragmento de audio pueda ocupar en la memoria inclusive décima parte -o menos- de lo que ocuparía de ser PCM.  La reducción en tamaño implica una pérdida de información y por esto a los formatos de este tipo se les llama formatos comprimidos con pérdida.

MPEG-1 Audio Layer 3

Más conocido como MP3, es un formato de audio digital comprimido con pérdida desarrollado por el Moving Picture Experts Group (MPEG) para formar parte de la versión 1 (y posteriormente ampliado en la versión 2) del formato de vídeo MPEG. El mp3 estándar es de 44 KHz y un bitrate de 128 kbps por la relación de calidad/tamaño. Su nombre es el acrónimo de MPEG-1 Audio Layer 3 y el término no se debe confundir con el de reproductor MP3.

La compresión se basa en la reducción del margen dinámico irrelevante, es decir, en la incapacidad del sistema auditivo para detectar los errores de cuantificación en condiciones  de enmascaramiento. Este estándar divide la señal en bandas de frecuencia que se aproximan a las bandas críticas, y luego cuantifica cada subbanda en función del umbral de detección del ruido dentro de esa banda.

Vorbis

Es un códec de audio libre y de compresión con pérdida. Forma parte del proyecto Ogg y entonces es llamado Ogg Vorbis. Puede codificar niveles de calidad desde CD- A y DAT-rate estéreo hasta 48kbps sin bajar la frecuencia de muestreo. Vorbis también está pensado para frecuencias bajas desde telefonía de 8kHz y hasta alta definición de 192kHz, y una gama de representaciones de canales (monoaural, polifónico, estéreo, cuadrafónico,  5.1,  ambisónico o hasta 255 canales discretos). Ogg Vorbis es totalmente abierto, libre de patentes; la biblioteca de referencia (libvorbis) por lo que cualquiera puede implementarlo ya sea tanto para aplicaciones propietarias como libres.

Windows Media Audio o WMA

Es un formato de compresión con pérdida de calidad, aunque recientemente se ha desarrollado una extensión de compresión sin pérdida. La licencia es propiedad de Microsoft y ha sido desarrollado básicamente con fines comerciales para el reproductor integrado en Windows, el Windows Media Player, aunque está muy por debajo tanto en calidad como en operatividad del nivel de los anteriores formatos, MP3 y Vorbis ya que por poner un ejemplo no permite modificar los parámetros de calidad de compresión y es complicado reducir el número de canales de audio, la tasa de bits, la profundidad de bits y la frecuencia de muestreo. El soporte de este formato se ha ampliado desde Windows Media Player y ahora se encuentra disponible en varias aplicaciones y reproductores portátiles. A diferencia del MP3, este formato posee una infraestructura para proteger el Copyright y así hacer más difícil el "tráfico ilegal" de música.

Real Audio

No es un formato cerrado, ni define un esquema de codificación propio. En sus diferentes versiones cambia de codificación utilizada. Algunas de las versiones emplean compresión CELP y otras GSM. Se emplea en internet para la reproducción en línea de contenidos de audio, aunque no se emplea en audio profesional.

Dolby Digital (AC-3)

Es un formato propietario cuyo funcionamiento es muy similar al estándar MPEG. Se diferencia en proporcionar una menor tasa de codificación y en tener codificado 5.1. canales de audio envolvente.

CD Audio

El formato CD audio no es más que una codificación PCM de 16 bits estéreo a 44100 muestras por segundo. No tiene por tanto ningún sistema de compresión de los datos. Simplemente almacena el conjunto de muestras resultado del proceso de cuantificación sin más procesamiento. 

MIDI

Este formato no es precisamente de audio digital, pero sí pertenece a las tecnologías de la informática musical. El archivo MIDI no almacena "sonido grabado", sino las indicaciones  para que un sintetizador o cualquier otro dispositivo MIDI "interprete" una serie de notas u otras acciones (control de un mezclador, etc. Es un archivo de poca capacidad (una canción  con veinte canales de instrumentos ocupa alrededor de 20 kilobtes) que se almacenan datos relativos a notas musicales. Podemos imaginarlos como algo similar a una partitura, con los nombres de los instrumentos que hay que utilizar, las notas, tiempos y algunas indicaciones acerca de la interpretación.

Antonio Ayala Coca

Publicar un comentario

0Comentarios

Publicar un comentario (0)

#buttons=(Ok, adelante!) #days=(20)

Nuestro sitio web utiliza cookies para mejorar su experiencia. Aprender más
Ok, Go it!