MonsterTracks: marzo 2015

jueves, 26 de marzo de 2015

Tips & Tricks - El uso del Dither

¿Ya has terminado de masterizar tu mezcla? Muy bien, pues ahora tendrás que intentar por todos los medios que los archivos digitales mantengan la máxima fidelidad posible.
Ya habíamos hablado en éste blog sobre las frecuencias de muestreo y los SRC´s, pero... ¿Y qué hay sobre el bitdepth? ¿Cómo podremos sacarle el mayor partido?.

-¿QUÉ BITDEPTH UTILIZAR?:

La respuesta es "el máximo posible". Si la frecuencia de muestreo influye sobre el ancho de banda del sonido, el bitdeph influye sobre la dinámica del sonido, y cuanto mayor sea el bitdepth mayor será la dinámica.
Hoy por hoy, el máximo bitdepth al que podemos grabar son 24 bits y el máximo bitdepth al que podemos trabajar en una sesión es de 32 bit flotantes.
Está demostrado que incluso cuando grabamos a 24bits y convertimos la señal a 16bits ganamos más dinámica que si grabamos directamente a 16bits, pero es necesario comprender cómo funcionan las señales cuando pasan de un bitdepth a otro más pequeño y poder tener control sobre dicha conversión.
Para hacer bien éstas conversiones tenemos que dejar claros algunos conceptos sencillos de entender.

-¿QUÉ ES TRUNCATION?:

Pongamos que ya tienes tu proyecto a 24bits o 32 flotantes pero tienes que sacar un archivo para CD que solamente soporta 16bits. Deberás reducir el bitdepth. Ésta reducción en la profundidad de bits se llama truncamiento, y efectivamente cuando hacemos éste cambio, la señal de audio se distorsiona armónicamente... y mucho además.

-¿QUÉ ES EL DITHER?:

Para muchos el dither es una opción que trae el L2 o el OZONE que se deja como está y ya... Espero que después de escribir éste post, todos sepamos bien lo que hacer con éstas opciones que traen algunos plugins.

http://www.waves.com/1lib/pdf/plugins/l2-ultramaximizer.pdf

El dither nace como una solución a la distorsión armónica producida cuando una señal digital se trunca.
El Dither es un ruido, no es un efecto, no es un procesamiento de la señal, no es una EQ,... ¡es simplemente ruido!.
Alguien descubrió que para eliminar las distorsiones armónicas producidas por el truncamiento bastaba con añadir una señal de ruido a la señal que queríamos truncar. El ruido enmascaraba la distorsión armónica. En éste vídeo podréis entender de forma sencilla lo que es el dither.

-¿CUÁNDO UTILIZAR DITHER?:

El dithering (o mejor dicho el redithering) es el acto de aplicar un dither (ruido) a una señal de audio cuando la vamos a truncar. Normalmente nos encontraremos una opción en los plugins que dice "Quantize", y es aquí donde tenemos que indicar el bitrate destino al que vamos a truncar nuestra señal.
Así que lo más importante es saber cuándo va a ser necesario truncar una señal y aplicar el dither una sola vez por cada truncamiento que necesitemos, ya que si aplicamos dither varias veces para un mismo truncamiento, lo que estamos haciendo es sumar ruidos, y creo que a nadie le gusta tener ruido en sus producciones.
¿Y cuándo? Pues normalmente al final de la cadena, sobre todo en el proceso de mástering, ya que es el último paso de todos antes de hacer el truncamiento para poder obtener un archivo digital con menor profundidad de bits. Se hace incluso después de la conversión de sample rate (SRC).
Pero también es útil cuando necesitamos utilizar procesadores externos que trabajan con señales de menor profundidad de bits que la que estamos utilizando.

Bob Katz tiene un artículo que te recomiendo leer sobre el workflow del dithering en varios escenarios posibles.

¿Y cuándo no? Si no vamos a hacer truncamiento no aplicaremos dither. En éste caso asegúrate de que los dithers de tus plugins están en la opción "none":

-LOS TIPOS DE DITHER:

Los ingenieros de sonido han dedicado mucho esfuerzo para ofrecernos diferentes tipos de ruido o tipos de dither para solucionar las distorsiones provocadas por el truncamiento. Hoy en día tenemos muchas opciones donde agarrarnos, pero cada técnico tiene sus preferencias personales basadas en su propia experiencia. Yo suelo elegir el tipo de dither en base a la señal que necesito truncar. Lo que intento es escuchar entre varios y finalmente elijo el que mejor me suene (suele coincidir que sea MBIT+ pero hay varios que me suelen funcionar bien). Y además, si nos fijamos en los manuales de los dithering podremos encontrar recomendaciones del fabricante para hacer una buena elección del dither.

Por otro lado, existe una opción llamada Noise Shaping (o shaping a secas) que viene a ser un filtro que se le aplica al dither para hacerlo menos audible.

http://sox.sourceforge.net/SoX/NoiseShaping

De la misma manera, en el manual de nuestros dither nos orientarán sobre la mejor aplicación de nuestros shaping en el dither.

He encontrado por internet algunos compañeros que se han molestado en preparar documentos comparativos para iluminarnos un poco más sobre la diferencia entre diferentes dithers y shapings:

-http://audio.rightmark.org/lukin/dither/dither.htm
-http://www.hispasonic.com/foros/comparativa-dither/427543
-http://theproaudiofiles.com/dither/

-¿CÓMO UTILIZAR DITHER?:

Así que, una vez que ya sabemos lo que es truncar, lo que es dither, y cuándo debemos aplicar dither, nos falta saber cómo exportar nuestros archivos truncados y con el dither aplicado.

El truncamiento se puede producir en:
-Un Bounce.
-Una consolidación de archivo modificando el bitdepth de la sesión.
-Una exportación de archivo.
-Una nueva grabación de la señal que queremos truncar en una sesión de menor bitdepth o en procesadores con menor bitdepth.

Deberemos asegurarnos de que antes de hacer cualquiera de éstos truncamientos, la señal va a pasar por un Dither.,

-ENLACES DE INTERÉS Y FUENTES:

Y para todos aquellos que necesitéis información más técnica y detallada, os facilito varios enlaces muy interesantes en los que me he apoyado para escribir éste post. Creo que te ayudarán a profundizar sobre el tema:

-http://www.digido.com/articles-and-demos12/13-bob-katz/16-dither.html
-http://www.soundonsound.com/sos/may07/articles/dpworkshop_0507.htm
-http://www.soundonsound.com/sos/mar10/articles/qanda0310_2.htm
-http://productionadvice.co.uk/when-in-doubt-dither/

-http://downloads.izotope.com/guides/izotope-dithering-with-ozone.pdf
-http://www.askaudiomag.com/articles/the-how-and-why-of-dithering-in-pro-tools/es -http://help.apple.com/logicpro/mac/9.1.6/es/logicpro/usermanual/index.html#chapter=29%26section=6%26tasks=true

Es sonido. Es MonsterTracks.

martes, 17 de marzo de 2015

Discussion - ¿Cual es la mejor frecuencia de muestreo?

Si comparamos el mundo de la imagen con el mundo del sonido, cualquiera puede pensar que para obtener la máxima calidad sonora, lo ideal sería elegir la más alta de las opciones que me ofrezcan mis DAW´s o mis grabadores (ya que en vídeo, cuanto más tamaño, más ppp, más profundidad de bit,... mejor imagen). Sin embargo ésto es absolutamente falso cuando hablamos de sonido, y es lo que pretendo dejar claro en ésta discusión.

Las frecuencias de muestreo más comunes en audio profesional son 44.1Khz, 48Khz, 88.2 Khz, 96Khz y 192Khz.
Pero... ¿Cual es la mejor opción de todas?.

Para responder a ésta pregunta tenemos que conocer la filosofía de funcionamiento del audio digital. Dejemos claro de forma sencilla y comprensible algunos aspectos al respecto.

-¿QUÉ ES FRECUENCIA DE MUESTRÉO?:

Como ya sabemos, la frecuencia de muestreo o sample rate es el número de muestras por unidad de tiempo que se toman de una señal contínua (analógica) para convertirla en una señal discreta (digital).

Hoy en día nuestros sistemas de grabación y nuestros DAW nos permiten elegir entre múltiples opciones de frecuencias de muestreo a las que grabar.

-¿POR QUÉ 44.1KHz ó 48KHz?:

Él teorema de Nyquits dice que "Para poder replicar con EXACTITUD una forma de onda es necesario que la frecuencia de muestreo sea superior al doble de la máxima frecuencia sonora que queremos digitalizar".

Y cuando dice con EXACTITUD no quiere decir otra cosa distinta, si no lo diría. Por lo tanto éste teorema descarta automáticamente el argumento de que a mayor frecuencia de muestreo mayor calidad de audio. Y ésto es así. Lo único que afirma el teorema es que a mayor frecuencia de muestreo mayor será la frecuencia sonora que podremos grabar con exactitud.

Por otro lado hay que tener en cuenta que el ser humano es capaz de escuchar frecuencias que van desde los 20Hz hasta los 20000Hz. (los hay que más y los hay que menos, pero cojamos éste ancho de banda que suele ser el standard establecido).
Por lo tanto, según el teorema de Nyquist, si quisiéramos digitalizar frecuencias de hasta 20000Hz (el máximo que el ser humano puede oír), lo ideal sería digitalizar a algo más del doble.

Y en éste punto podemos deducir que 44.1Khz o 48Khz es una frecuencia de muestreo ideal para grabar con exactitud frecuencias sonoras de hasta 20000 Hz. Pero entonces... ¿por qué podemos elegir entre frecuencias de muestreo mayores?

-¿POR QUÉ 88.2KHz ó 96KHz?:

Todos hemos visto alguna vez cómo una rueda de un coche que está en marcha va girando cada vez más y más rápido hasta que llega un punto en el que percibimos que la rueda se va relentizando hasta pararse e incluso hasta ir hacia atrás. No es que la rueda haya dejado de girar, es solamente una percepción.

Algo parecido ocurre con todas las frecuencias sonoras superiores a la frecuencia máxima que podemos capturar según el teorema de Nyquist. Éstas frecuencias se grabarán dentro del espectro (a modo de espejo o de solapamiento) aunque originalmente no corresponden a dicho espectro, o lo que es lo mismo, se convertirán en distorsión armónica no deseada en absoluto. Es el llamado efecto aliasing.

Para que el conversor A/D no capte las frecuencias por encima del espectro audible, se aplica un filtro pasa bajos llamado filtro antialiasing, pero éste filtro (por la propia naturaleza de los filtros pasa bajos) a su vez atenúa la señal de las frecuencias más agudas que grabamos del espectro audible (a partir de 17 Khz).

Si cogemos nuestra frecuencia de muestréo de 44.1Khz y la duplicamos a 88.2Khz (oversampling), resolvemos ésta atenuación de las frecuencias agudas porque podemos llevarnos el filtro antialiasing hacia un espectro más agudo fuera del espectro audible.

Pero además, éste oversampling resuelve otro problema llamado "sinc problem" que también crea atenuaciones en las frecuencias agudas y que es generado por el propio proceso de la digitalización. Y como no me quiero meter en demasiado berengenal técnico, para quien quiera más información detallada al respecto y quiera profundizar sobre ésto os dejo un enlace a los "White Papers" de Dan Lavry".

-¿POR QUÉ 192KHz?:

En éste punto, podríamos volver a considerar que a mayor frecuencia de muestreo más calidad de sonido, pero no nos dejemos llevar por las emociones ni por las apariencias, ya que ésto no es así en absoluto.

Debemos considerar que cuanto mayor es la frecuencia de muestreo, mayor es el tamaño de nuestros archivos y por lo tanto mayores serán los recursos que necesitaremos para mover éstos archivos. Pero no es solo éste el problema, sino que existe un compromiso entre la precisión sonora y la velocidad de muestreo debido a las características de los circuitos, a los condensadores de carga, el amplificador... Y es por ésto que existe una frecuencia de muestreo óptima que resuelve todos los inconvenientes mencionados anteriormente y por lo que mayor velocidad de muestreo no siempre va a ser mayor precisión sonora.
Curiosamente Dan Lavry sitúa en uno de sus documentos que la frecuencia óptima de muestreo está en 60Khz.

"At 60 KHz sampling rate, the contribution of AD and DA to any attenuation in the audible range is negligible.

Although 60 KHz would be closer to the ideal; given the existing standards, 88.2Khz and 96 KHz are closest to the optimal sample rate."

Así que la primera y rotunda conclusión de todo ésto es que una frecuencia de muestreo de 192Khz es una opción bastante "fuera de lugar" porque no ofrece mayor calidad y porque ocupa muchísimo espacio en nuestro disco duro y consume demasiados recursos.

Así que de nuevo surge la duda... cual será la mejor frecuencia de muestreo para trabajar?

-SRC O SAMPLE RATE CONVERSION:

Para determinar cual es la mejor frecuencia de muestreo a la que trabajar es imprescindible hacer un análisis de la frecuencia de muestreo a la que se va a distribuir el producto. Ya que si para distribuir nuestro producto tenemos que hacer una conversión a una nueva frecuencia de muestreo, ésto podrá empeorar la calidad sonora notablemente.
Ésta conversión de frecuencias se denomina SRC (Sample Rate Conversion), y suele ser una opción que nos ofrece nuestras DAW´s cuando exportamos o cuando hacemos bounces.
Normalmente, cuando se utiliza el SRC, creemos o confiamos en que nuestra DAW va a hacer bien ésta conversión, pero la realidad es que no todos los SRC son buenos.

http://src.infinitewave.ca/

Y por otro lado podemos conseguir SRC´s gratuitos de máxima calidad como éste

http://www.voxengo.com/product/r8brain/

-MIS CONCLUSIONES:

Me resulta muy dificil sacar una conclusión firme, clara y rotunda sobre cual es la mejor frecuencia de muestreo a la hora de grabar, ya que existen muchísimos argumentos válidos que defienden unas u otras frecuencias.

Siempre y cuando conozcamos las ventajas e inconvenientes de cada una de las frecuencias de muestreo en grabación, podremos elegir la frecuencia que mejor se adapte cada proyecto.
A pesar de todo me mojaré y os contaré mis conclusiones:

- Nunca grabo con frecuencias de muestreo mayores de 96Khz. No ofrece nada más que desventajas.

- Nunca subestimo las frecuencias de muestreo de 44.1Khz o de 48Khz. Son frecuencias de muestreo que ofrecen una calidad sonora absolutamente profesional.

- Decido qué frecuencia de muestreo utilizo en grabación cuando conozco la frecuencia de muestreo de la distribución.

MonsterTracks