Escrito por Matias Greco | Úta, Google ya no es beta… pero yo sigo siendolo

Se le llama formatos lossless a los formatos de compresión de audio que privilegian la calidad del sonido ante el tamaño del  archivo de audio resultante. Esto, gracias a la masificación de sistemas de hardware de alta capacidad y a la crecida de la velocidad en conexiones a internet, ha logrado popularizarse de gran manera mientras el mp3 cada vez pierde cabida en mundo del audio y la música.

En el mundo profesional, el WAV PCM es y será el formato de audio más ocupado, por su fácil manejo en la codificación y su alto grado de confiabilidad, sin embargo en la música que tenemos en nuestras bibliotecas esto es poco factible, debido a gran espacio en disco que ocupa.

Por lo mismo, desde hace casi 20 años se intenta innovar en este sentido, cuando se creó el MP3 de manos de Moving Picture Experts Group (MPEG), el cual aprovecha las falencias de nuestro sistema auditivo para eliminar datos “irrelevantes”.

Ahora pasaremos a analizar algunos de los métodos de compresión, sus pro y sus contra.

Principalmente la codificación del mp3, reduce el rango dinámico irrelevante y se aprovecha de la incapacidad del sistema auditivo para detectar los errores de cuantificación en condiciones de enmascaramiento, o sea que enmascara los errores de cuantificación con el nivel de sus frecuencias vecinas. Esto se realiza en función de un método llamado “Predicción polinómica”, el cual analiza la señal de audio y predice cual es la cantidad de  ruido de cuantificación que le es posible inducir en función de la frecuencia, obteniendo así un umbral de enmascaramiento, aprovechándose de que a nuestro sistema auditivo le es imposible determinar cambios frecuenciales que estén dentro de un 1/3 de octava, por lo mismo los ecualizadores gráficos tienen bandas de 1/3 de octava.  Este proceso se realiza mediante un análisis discreto mediante una serie de Fourier, a través del algoritmo de la transformada rápida de Fourier (FFT).Los formatos lossless, término genérico para cualquier tipo de fichero digital que reduzca el tamaño del archivo sin perdida de datos, como por el ejemplo el Flac (Free Lossless Audio Codec) aplican una reducción del tamaño del fichero de audio mucho menor a la que usan los formatos lossy como MP3 o WMA, pero conserva en su totalidad la cantidad de información. En la práctica, los formatos lossless usan un algoritmo en base a la predicción lineal para convertir las muestras en series de pequeños números no correlativos, lo que sumado a la codificación por longitud de pista, que aprovecha los silencios y los lugares donde la representación numérica del audio presenta repeticiones, reducen el tamaño del archivo.

Ejemplo de codificación en PCM, donde en un silencio se usa una cantidad de muestras fijas. Ejemplo de codificación en FLAC, donde se aplica una codificación por longitud de pista, tomando solo una muestra al inicio y una al fin de los datos repetitivos.

Si bien, para oídos no entrenados, la diferencia entre un mp3 codificado a 192kbps versus un formato Lossless escuchados en un sistema casero no es notoria, si los escuchamos y comparamos en un sistema de alta  fidelidad, en un mp3 se notara la ausencia de agudos y los grabes y medios tendrán un ruido, por lo tanto la coloración del sonido será diferente.

Fase de pruebas:

Produciremos un ruido blanco y lo codificaremos en FLAC y luego en MP3. Si analizamos los espectros de frecuencia de un ruido blanco, que tiene la misma cantidad de energía en todas sus frecuencias tendremos esto:

El archivo FLAC  se ve más oscuro que el MP3, debido a que tiene la energía en cada frecuencia de manera uniforme. Además podemos notar que al codificar en MP3 se aplica un filtro “corta altos” de orden prácticamente infinito, con una frecuencia de corte en los 15,5 kHZ, por lo que no existe energía en frecuencias superiores a 15,5 kHz. Debido a que nuestro oído es capaz de percibir frecuencias de hasta los 20 kHZ, esto provocara una perdida de coloración en el sonido resultante al ser escuchados en sistemas de alta fidelidad.

Conclusión

Si bien los formatos de audio Lossless, como el FLAC o APE realizan una representación muy fidedigna de la señal, para el mundo profesional el WAV PCM continuara siendo el predilecto, debido a que trae consigo una gran confiabilidad.

Para el mundo no profesional, como para el emergente mercado de las disqueras dentro del mundo del internet o las DAP (Digital Audio Player), los formatos lossless aun no logran estandarizarse y el mp3 sigue llevando la delantera, que -por ejemplo- a pesar de ser licenciado y tener que pagar por agregar un códec al reproductor aun no logra sacarse ser reemplazado por algún otro formato de compresión sin perdida, libre de licencias y con alta calidad de audio.

La representación fidedigna empleada comúnmente como referencia es la de un CD, codificado a una frecuencia de muestreo de  44,1 kHz y 16bits en formato tipo WAV PCM, donde si comparamos sus espectros de frecuencia con los de un formato lossless son iguales. Por lo mismo, si un archivo tipo FLAC luego creamos una copia codificada en MP3, le invertimos la fase y los mezclamos, podemos escuchar los rastros que deja la codificación en mp3, donde todas las frecuencias altas superiores a 15,5khz fueron cortadas y, aun más notorio, las frecuencias criticas que están dentro del rango de frecuencias medias.

Estas características dan a los formatos lossless como el FLAC una supremacía por sobre los formatos lossy de compresión con perdida como el MP3, y lo impulsan a comenzar a liderar el actual mercado de las reproducciones caseras, que a pesar de usar más espacio en disco, la emergente crecida de la velocidad en las conexiones a internet y la exponencial crecida del tamaño de almacenamiento tanto en discos duros como en memorias flash, le dan a este formato un mejor posicionamiento en cuanto a performance y rendimiento.

Cabe mencionar que el convertir el tiempo en una serie de muestras es algo muy complejo que lleva consigo una perdida implícita. Al convertir una señal continua en una serie de muestras discretas, estamos truncando el tiempo, y a pesar de que para nuestro oído las diferencias prácticamente no sean notorias, hay una gran pérdida de información de por medio que nuestras muestras no pueden captar.