Mezclando con Auriculares (Parte 2)

Vicente Frías
By -
0


En Mezclando con Auriculares 1 exploramos el ascenso de la escucha con auriculares, que culminó en la situación actual en la que la escucha con auriculares ha suplantado la escucha con altavoz en la gran mayoría de las decisiones de compra de música y el consumo activo de música. Como profesionales del audio, sería una tontería subestimar la importancia de los auriculares en nuestras decisiones de mezcla y monitoreo, pero ¿Cómo podemos reducir nuestra dependencia de una tecnología institucionalizada (los monitores) que en última instancia se ha vuelto irrelevante para la mayoría del mercado consumidor de música? No podemos simplemente anunciar que abandonaremos los monitores por auriculares, porque existen diferencias significativas entre mezclar a través de monitores y mezclar a través de auriculares.


La reproducción de los altavoces trae muchos cambios a nuestra mezcla; Lo que escuchamos por los monitores no es lo que sale de la mesa de mezclas o DAW. El sonido que escuchamos en nuestra posición de monitoreo tiene la respuesta de frecuencia y la distorsión de nuestros monitores incorporadas, la acústica de nuestra sala de escucha superpuesta y posiblemente se le ha introducido un filtrado de peine debido a los reflejos de nuestras superficies de trabajo.


Si la tonalidad de sus mezclas no se traduce de manera aceptable para otros monitores fuera de su sala de mezclas, significa que sus decisiones de mezcla están siendo influenciadas por problemas de respuesta de frecuencia provenientes de sus monitores y/o la acústica de su sala de mezclas. Si sus mezclas tienen niveles de reverberación significativamente diferentes y/o problemas extraños de panorámica cuando se escuchan en otros monitores fuera de su sala de mezclas, significa que sus decisiones de mezcla están siendo influenciadas por la reverberación y los reflejos de primer orden de su sala de mezclas. Si la tonalidad de algunos sonidos dentro de tu mezcla (particularmente la caja) cambia significativamente cuando te inclinas hacia adelante o hacia atrás desde tu posición normal de mezcla, significa que tienes un peine filtrándose en tu superficie de trabajo y estás perdiendo el tiempo tratando de encontrar la posición de mezcla correcta porque probablemente no existe...


La mayoría de los altavoces de monitor contemporáneos brindan un rendimiento aceptable dentro del ancho de banda previsto, lo que significa que los problemas descritos anteriormente no son  causados ​​por sus monitores y, por lo tanto, comprar monitores nuevos no es la solución (a menos que esté viviendo en ese mundo de fantasía acústica donde los bailes estremecedores (los subsónicos del piso provienen de monitores de escritorio del tamaño de una caja de zapatos). La solución inteligente es buscar el consejo de un acústico. Alternativamente, podrías dejar de depender de grandes monitores y los tratamientos acústicos que requieren, y pasar a mezclar con auriculares, que es, casualmente, de lo que se trata este articulo. Así que sigue leyendo...


COMPENSACIONES VARIABLES

La escucha con altavoz introduce muchas variables que no existen con la escucha con auriculares. Compensar esas variables con los pequeños ajustes y refinamientos continuos que tienen lugar durante el curso de una mezcla, en respuesta a referencias cruzadas con otros oradores, cambios de postura al sentarse, comentarios de otros dentro de la sala pero fuera del punto óptimo, volver a la mezcla después de un descanso, etc., tiende a hacer que nuestras mezclas sean más resistentes y, por lo tanto, mejora su traducción en numerosos sistemas de reproducción.

Una mezcla realizada sólo con altavoces normalmente necesitará muy pocos ajustes para que suene "correcto" cuando se escuche a través de auriculares, aunque es posible que no aproveche todo lo que los auriculares tienen para ofrecer. Una mezcla hecha sólo con auriculares puede aprovechar todo lo que los auriculares tienen para ofrecer, pero a menudo necesitará ajustes considerables para que suene "correcto" cuando se escuche a través de los altavoces.

¿Cómo podemos hacer mezclas "relevantes para el mercado" que exploten las fortalezas de los auriculares sin perder los beneficios de "ajuste de variables" que introduce la mezcla de altavoces? Podemos comenzar por comprender a) cómo funciona la audición humana, b) qué oímos y sentimos cuando escuchamos a través de altavoces, y c) qué no oímos ni sentimos cuando escuchamos a través de auriculares...


¿CÓMO FUNCIONA LA AUDICIÓN HUMANA?

Los seres humanos tenemos dos oídos, uno a cada lado de la cabeza, para captar dos versiones ligeramente diferentes del mismo sonido. El sistema oído/cerebro utiliza las diferencias entre estas dos versiones del mismo sonido para determinar de dónde proviene ese sonido en un proceso llamado "localización".

La siguiente ilustración muestra a un oyente recibiendo información de sonido de una fuente de sonido ubicada a la izquierda del centro. Hay tres mecanismos de "diferencia" que el sistema oído/cerebro utiliza para localizar la fuente de sonido y, para este ejemplo, todos ocurren porque el oído derecho está más lejos de la fuente de sonido que el oído izquierdo.



En primer lugar, el sonido llegará al oído derecho poco tiempo después de llegar al oído izquierdo, creando una diferencia de tiempo interaural (ITD), que a veces se denomina diferencia de fase interaural (IPD), especialmente en frecuencias más bajas donde la longitud de onda es más larga que el ancho de la cabeza humana promedio y, por lo tanto, la diferencia de tiempo ocurre dentro de un ciclo.

En segundo lugar, la señal que llega al oído derecho ha viajado más lejos que la señal que llega al oído izquierdo y, por lo tanto, tendrá un SPL más bajo debido a la Ley del Cuadrado Inverso. Esto crea una diferencia de amplitud interaural (IAD), que a veces se denomina diferencia de nivel interaural (ILD).

En tercer lugar, debido a que la señal en el oído derecho viaja a través de la cara del oyente y entra en el pabellón derecho desde un ángulo diferente al que entra en el pabellón izquierdo, la señal que llega al oído derecho tendrá un espectro de frecuencia diferente al de la señal que llega al izquierdo. oído debido a la "sombra acústica" de la cabeza, la absorción del cabello, los reflejos de la piel, la difracción a través de la cara y los numerosos filtros de peine y resonancias de cavidad introducidas por el pabellón auricular. Todo esto da como resultado una diferencia espectral interaural (ISD).

En conjunto, los ITD, IAD e ISD se denominan 'HRTF' (Funciones de transferencia relacionadas con la cabeza), porque representan los cambios impuestos a la señal a medida que pasa alrededor de la cabeza del oyente hasta sus oídos. El sistema oído/cerebro utiliza las diferencias entre los HRTF izquierdo y derecho para determinar de dónde proviene un sonido, es decir, para localizarlo.


Volumen vs Frecuencia

Una peculiaridad importante del oído humano es que su sensibilidad a las frecuencias individuales cambia con el SPL. Con SPL más bajos somos menos sensibles a las frecuencias bajas y altas que a las frecuencias medias, mientras que con SPL más altos nuestra sensibilidad a las frecuencias bajas y altas aumenta significativamente.

Este comportamiento se muestra en el siguiente gráfico, que contiene varios "contornos de sonoridad igual". Cada contorno utiliza un tono de 1 kHz a un SPL establecido como referencia y muestra cuánto SPL se requiere para que otras frecuencias se perciban como "igualmente fuertes" que la referencia de 1 kHz.


Cada contorno está etiquetado con un valor Phon, que representa el SPL del tono de referencia de 1 kHz. Por ejemplo, el contorno de 80 Phon muestra los SPL necesarios para que diferentes frecuencias se perciban como "igualmente fuertes" que un tono de 1 kHz que se reproduce a 80 dB SPL. Como se muestra en el gráfico siguiente, 125 Hz necesitará un SPL de aproximadamente 89 dB para que se perciba como "igual de alto" que 1 kHz a 80 dB SPL. De manera similar, 8 kHz necesitaría un SPL de aproximadamente 92 dB para ser percibido como "igual de alto" que 1 kHz a 80 dB SPL.


Para decirlo de otra manera, digamos que tenemos tres osciladores de onda sinusoidal separados: uno que genera un tono de 1 kHz, otro que genera un tono de 125 Hz y el tercero que genera un tono de 8 kHz. Si la salida del oscilador de 1 kHz se ajustó para proporcionar un SPL de 80 dB, la salida del oscilador de 125 Hz tendría que ser 9 dB más alta que el oscilador de 1 kHz para sonar como si fuera "igualmente fuerte", y la salida del oscilador de 8 kHz necesitaría ser 12 dB más alta que el oscilador de 1 kHz suene como si fuera "igualmente fuerte". Entonces, un tono de 125 Hz a 89 dB SPL, un tono de 1 kHz a 80 dB SPL y un tono de 8 kHz a 92 dB SPL tendrán todos "el mismo volumen", pero esas diferencias sólo se aplican cuando estamos en la curva de 80 Phons (es decir, 1 kHz a 80 dB SPL). . Si cambiamos el SPL del tono de 1 kHz, las diferencias necesarias para que otras frecuencias suenen "igualmente fuertes" también cambiarán, como se ve por las diferentes formas de los contornos de igual sonoridad. Si todos tuvieran la misma forma no tendríamos que pensar en cómo nuestra mezcla se traducirá a diferentes niveles de reproducción...


Los contornos de igual volumen nos muestran que a medida que el SPL aumenta, el oído se vuelve más sensible a las frecuencias bajas y altas. Esto significa que una mezcla hecha con un nivel de monitoreo alto sonará carente de energía de frecuencias altas y bajas cuando se escuche a un nivel de monitoreo bajo, y una mezcla hecha con un nivel de monitoreo bajo tendrá energía de frecuencias altas y bajas excesiva cuando se escuche a un nivel más alto. En otras palabras, el espectro de frecuencia y el equilibrio tonal de nuestras mezclas se ven afectados por el nivel de monitoreo utilizado al mezclar.

La siguiente ilustración muestra lo que sucede si mezclamos en un nivel de monitoreo alto pero reproducimos en un nivel de monitoreo bajo. El contorno azul representa el equilibrio de frecuencias en una mezcla realizada con un alto nivel de monitoreo de 100 Phons, y el contorno rojo representa cuánta energía se necesita para que esa mezcla tenga el mismo equilibrio de frecuencia percibido (es decir, suene igual) cuando se escucha a un nivel de monitoreo bajo de 40 Phons. Cualquier frecuencia en el contorno azul que esté por debajo del contorno rojo será más silenciosa de lo previsto en la mezcla, y cualquier frecuencia en el contorno azul que esté por encima del contorno rojo será más fuerte de lo previsto en la mezcla.


En el gráfico anterior podemos ver que una mezcla realizada con un nivel de monitorización alto carecerá gravemente de energía de baja y alta frecuencia si se escucha con un nivel de monitorización bajo. Curiosamente, esta es exactamente la razón por la que algunos sistemas de alta fidelidad tienen un botón de "sonoridad": aumenta las frecuencias bajas y altas de una manera muy similar a las diferencias entre los contornos azul y rojo que se muestran arriba, permitiendo que música que se escuche a un nivel muy bajo (para evitar despertar a la familia, por ejemplo) y al mismo tiempo se perciba un equilibrio suficiente entre las frecuencias bajas y altas.

El mismo problema ocurre al revés, como se muestra a continuación. El contorno azul representa el equilibrio de frecuencias en una mezcla realizada con un nivel de monitoreo bajo de 40 Phons, y el contorno rojo representa cuánta energía se necesita para que esa mezcla tenga el mismo equilibrio de frecuencia percibido (es decir, suene igual) cuando se reproduce a un alto nivel de seguimiento de 100 Phons. Cualquier frecuencia en el contorno azul que esté por encima del contorno rojo será más alta de lo previsto en la mezcla, y cualquier frecuencia en el contorno azul que esté por debajo del contorno rojo será más silenciosa de lo previsto en la mezcla. Podemos ver que una mezcla hecha en un nivel de monitoreo bajo tendrá energía alta y baja excesiva si se reproduce en un nivel de monitoreo alto.


Ninguna de las mezclas mostradas arriba se traducirá bien en diferentes niveles de reproducción (ni siquiera a través de los monitores en los que se mezclaron) y ambas requerirán un ecualizador correctivo en la masterización o tal vez incluso una remezcla, lo que significa más tiempo y más costo. Mezclar en voz alta es un orgullo, mezclar en silencio es de buena educación, pero en ambos casos estás mezclando a crédito: se siente bien ahora pero lo pagarás más tarde porque para todo lo demás está la tarjeta de masterización...

También vale la pena señalar que durante un largo día mezclando, nuestros mecanismos auditivos se cansan o se "fatigan", y esto hace que sin darnos cuenta aumentemos el nivel de monitoreo para que las cosas sigan sonando emocionantes. Aunque nuestros mecanismos auditivos sufren fatiga, los contornos de igual sonoridad siguen siendo los mismos, por lo que al aumentar el nivel de monitoreo, sin darnos cuenta, estamos cambiando nuestra "línea base" auditiva a un contorno de igual sonoridad más alto, incurriendo en todos los problemas que eso conlleva. Si tuviera que mezclar cinco canciones durante un día de 15 horas en el estudio, no sería sorprendente encontrar que durante la reproducción del día siguiente (con la audición descansada) la primera mezcla hecha el día anterior suena bien, pero la última mezcla hizo la el día anterior falta considerablemente en frecuencias bajas y altas. ¿Por qué? Porque el nivel de monitoreo aumentó regularmente a lo largo del día en que se realizaron las mezclas, de modo que la última mezcla se realizó en un contorno de volumen igual muy diferente al de la primera mezcla.

Por estas razones, las instalaciones de audio profesionales calibran todos sus sistemas de monitoreo a un SPL estándar, generalmente alrededor de 80 Phons (por ejemplo, el control de volumen de monitoreo se ajusta de modo que un tono de 1 kHz a -20 dBFS o 0 dB VU en el bus estéreo cree un SPL de 80 dB en la posición de monitorización), lo que ayuda a mantener la coherencia espectral de una mezcla a otra y dentro de un rango de niveles de reproducción de aproximadamente 60 Phons a 100 Phons.


La ilustración anterior muestra cómo una mezcla realizada a un nivel de monitoreo de 80 Phons (azul) se traduce en niveles de monitoreo más altos (100 Phons, verde) y niveles de monitoreo más bajos (60 Phons, rojo). En ambos casos, las diferencias percibidas por encima de 500 Hz son insignificantes. Por debajo de 500 Hz, cuando la mezcla de 80 Phons se reproduce a 100 Phons, habrá un aumento gradual en la energía de baja frecuencia percibida (aumentando a +10 dB a 31,5 Hz), y cuando la mezcla de 80 Phons se reproduce a 60 Phons, habrá un aumento gradual. Disminución de la energía percibida de baja frecuencia (cayendo a -10 dB a 31,5 Hz). Estos cambios no son ideales, pero son aceptables considerando que ocurren en un rango de 40 dB (de 60 Phons a 100 Phons) y mantienen una consistencia muy alta por encima de 500 Hz en todo ese rango.

80 Phons o algo así también es un buen nivel para minimizar la fatiga auditiva a corto plazo y el daño auditivo a largo plazo, y actúa como señal de advertencia: si el volumen de monitoreo calibrado no se siente lo suficientemente alto durante una sesión larga, significa a) el oído del ingeniero se está fatigando y es hora de tomar un descanso, o b) el nivel medido de la mezcla es inferior al nivel de calibración elegido (normalmente con un promedio de -20 dBFS o 0 dB VU) y debe ajustarse o compensarse en consecuencia.

El uso de un nivel de monitorización calibrado agiliza todo el proceso, desde la grabación hasta la masterización, mejora la "confianza en la mezcla" y la traducción, y elimina la temida decepción de la "luz fría del día", es decir, la mezcla que sonaba increíble al final de un largo día en el estudio suena decepcionante cuando se escucha a la mañana siguiente a través de oídos nuevos y en un nivel de reproducción más civilizado (es decir, más bajo).

Siempre debemos ser conscientes de nuestros niveles de monitorización, independientemente de si utilizamos altavoces o auriculares.

Como cuestión de interés, invertir los contornos de sonoridad igual, como se muestra a continuación, permite considerarlos como gráficos de respuesta de frecuencia estadísticamente promediados del oído humano. Esto hace que sea más fácil ver cómo cambia la sensibilidad de frecuencia de la audición humana con el SPL.



¿QUÉ ESCUCHAMOS CON LOS ALTAVOCES?

La siguiente ilustración muestra la configuración correcta para la reproducción estéreo a través de altavoces, donde los centros acústicos de los altavoces del monitor forman dos puntos de un triángulo equilátero y el oyente está alineado con el tercer punto. Por lo tanto, la imagen estéreo es capaz de extenderse 60° delante del oyente (±30° a cada lado del centro).


El altavoz izquierdo proporciona los IAD y los ITD que están integrados en la mezcla para el oído izquierdo, y el altavoz derecho proporciona los IAD y los ITD que están integrados en la mezcla para el oído derecho. Un oyente en la posición de monitoreo adecuada recibe estas señales en las relaciones correctas para reconstruir la imagen estéreo contenida en la grabación.



Imágenes Fantasmas

Las fuentes de sonido se localizan fácilmente en cualquier lugar del espacio entre los altavoces en un proceso conocido como imagen fantasma . En el ejemplo que se muestra a continuación, se percibe que la fuente de sonido proviene de la izquierda del centro, pero no hay ninguna fuente de sonido en esa ubicación. El sonido localizado es, por tanto, una imagen fantasma . Cuando puede escuchar una fuente de sonido que no puede ver en una imagen estéreo (por ejemplo, una voz directamente en el centro de un sistema estéreo), está escuchando una imagen fantasma. La capacidad de crear una imagen fantasma es el núcleo de la creación de un escenario sonoro estéreo; sin él, solo tendríamos sonidos provenientes de la izquierda y de la derecha.


[Con las técnicas y/o el procesamiento de micrófonos adecuados, podemos hacer que una fuente de sonido aparezca justo frente a nuestras narices, muy atrás detrás de los parlantes o incluso extenderse más allá de los lados de los parlantes. Este tipo de ilusión también se crea fácilmente con grabaciones binaurales reproducidas a través de auriculares, pero eso solo funciona cuando se escucha a través de auriculares.]



Diafonía interaural y más...

Como no existe aislamiento acústico entre los dos altavoces, parte del sonido destinado al oído izquierdo llegará al oído derecho y viceversa. Esto crea una forma de diafonía interaural.

Cada mezcla estéreo contendrá IAD debido al uso del potenciómetro de panorama y/o efectos de panorama, y ​​también tendrá IAD si tiene pistas estéreo que fueron grabadas por una coincidencia (por ejemplo, XY) o casi coincidente (por ejemplo, ORTF). par de micrófonos. Del mismo modo, cada mezcla estéreo contendrá ITD debido al uso de procesadores de efectos estéreo basados ​​en tiempo (reverberación, retardo, etc.), y también tendrá ITD si tiene pistas estéreo que fueron grabadas de forma casi coincidente (por ejemplo, ORTF). ) y/o pares de micrófonos muy espaciados (por ejemplo, AB, transparencias de batería).


La diafonía interaural permite que los IAD e ITD de los canales izquierdo y derecho se mezclen en el aire, reduciendo la audibilidad de las diferencias entre ellos y reduciendo así el ancho percibido de la imagen estéreo. También puede provocar la percepción de un filtrado en peine si la mezcla en sí contiene retrasos de 25 ms (0,025 s) de duración o menos entre los canales.



Los oradores y la sala

Otro desafío surge porque cada hablante sigue siendo una fuente de sonido distinta y, por lo tanto, crea sus propios ITD e IAD, lo que en última instancia le dice al sistema oído/cerebro que en realidad solo hay dos fuentes de sonido, lo que entra en conflicto con los ITD y IAD integrados en la mezcla. Estos efectos secundarios y los cambios de imagen causados ​​por la diafonía interaural descrita anteriormente se compensan inherentemente cuando se mezcla a través de altavoces porque el nivel y la panorámica de cada señal se ajustan según sea necesario para que suene correctamente.

Escuchar a través de monitores también introduce la posibilidad de reflejos de primer orden de superficies cercanas en el espacio de escucha que se superpondrán a la reproducción y, en última instancia, confundirán cualquier información espacial de la grabación misma; tales problemas pueden interferir en gran medida con las decisiones de panorámica. La mayoría de los entornos de escucha también tendrán cierta reverberación propia, lo que en última instancia afecta los niveles de reverberación que agregamos a la mezcla (más sobre esto a continuación). Los reflejos y la reverberación de la sala se abordan con un tratamiento acústico en una sala de control de estudio o en una sala de mezclas, pero pueden ser un problema al escuchar en general a través de monitores fuera del entorno del estudio.

Si introducimos suficiente información espacial (reverberación, etc.) en nuestras mezclas, la presencia sonora de los altavoces y la sala se vuelve insignificante, suponiendo que la sala sea acústicamente aceptable para empezar. Una buena mezcla trasciende los monitores y la sala, y con suerte invoca una 'suspensión voluntaria de la incredulidad': ese sentimiento cuando una mezcla de alguna manera te transporta a otro lugar, dimensión o mundo donde no puedes ver al hombre detrás de la cortina.



Impacto visceral

La palabra "vísceras" se refiere a los órganos internos blandos del cuerpo humano: los pulmones, el corazón, los órganos digestivos, los órganos reproductivos, etc. Por lo tanto, 'impacto visceral' se refiere al impacto que tiene el sonido o la mezcla en los órganos internos blandos de nuestro cuerpo; en otras palabras, cómo "sentimos" físicamente el sonido. Los sonidos de baja frecuencia tienen las longitudes de onda más largas y generalmente la energía más alta de todos los sonidos en una mezcla y, por lo tanto, proporcionan el impacto más visceral.

Se suele decir que las bajas frecuencias estimulan las glándulas suprarrenales (ubicadas encima de los riñones), haciendo que generen la hormona 'adrenalina' que es la encargada de hacernos querer movernos y bailar cuando escuchamos música. Sin embargo, hay pocas investigaciones que corroboren esto. Si la adrenalina debida al impacto visceral fuera un factor necesario para bailar, entonces las discotecas silenciosas, las raves silenciosas y eventos similares, todos basados ​​en personas bailando con música que se escucha a través de auriculares, no existirían.



¿QUÉ NO OÍMOS CON LOS AURICULARES?

La escucha con auriculares difiere mucho más de la reproducción de los altavoces de lo que la mayoría de la gente supone. No hay acústica en la sala de escucha que altere la respuesta de frecuencia, no hay diafonía interaural que altere la imagen estéreo e introduzca un filtrado de peine acústico en el espacio entre los altavoces, y no hay impacto visceral que agregue una sensación de emoción mejorada/exagerada. .

Lo que escuchamos al mezclar con auriculares es la mezcla estéreo directamente desde nuestro DAW, sin influencias externas más que la respuesta de frecuencia y las distorsiones de los auriculares y el amplificador que los impulsa. Un buen par de auriculares puede ofrecer de manera consistente y confiable frecuencias que se extienden considerablemente por encima y por debajo del rango del oído humano. Por lo tanto, parece lógico que un par de auriculares de baja distorsión con una respuesta de frecuencia perfectamente plana proporcionen la referencia de audio definitiva. ¿Bien? La respuesta es "" para escuchar, pero "no" para mezclar. ¿Por qué no?

Una mezcla realizada en altavoces contiene compensaciones para esas influencias externas tal como existían en la sala de mezclas (respuesta de frecuencia, acústica de la sala, diafonía interaural, impacto visceral, etc.) y esas compensaciones, en última instancia, hacen que la mezcla sea más resistente , dándole una mejor traducción a través de una gama más amplia de sistemas de reproducción. La mezcla con auriculares no tiene esas influencias externas y, por lo tanto, nuestras mezclas con auriculares no las compensan ni las permiten, lo que da como resultado mezclas menos resistentes y más "específicas para auriculares" que no se traducen tan bien en la reproducción a través de altavoces y, a veces, incluso a través de otros tipos de auriculares.



AGREGAR RESILIENCIA

¿Qué podemos hacer para incorporar esas valiosas compensaciones de 'mezcla de altavoces' en nuestro proceso de mezcla de auriculares y así hacer que nuestras mezclas de auriculares sean más resistentes? Comencemos viendo lo que los fabricantes de auriculares están haciendo con las respuestas de frecuencia, luego veremos problemas de mezcla más complicados, como entender el panorama en los auriculares, establecer una referencia de reverberación cuando no hay sala de mezcla y anticipar problemas que podría deberse a una diafonía interaural que no se produce al monitorear con auriculares.



Respuesta de frecuencia y voz

Uno de los objetivos de los fabricantes de altavoces, independientemente de si sus productos están destinados a un uso profesional o de consumo, es crear altavoces con una respuesta de frecuencia relativamente plana de 20 Hz a 20 kHz. La mayoría de los monitores de estudio incluyen su gráfico de respuesta de frecuencia en la documentación que los acompaña; rara vez es una línea perfectamente plana, pero si las desviaciones son graduales y permanecen dentro de aproximadamente ±2 dB en todo el ancho de banda previsto, los monitores se consideran aceptables y podemos aprender a trabajar con ellos. La siguiente ilustración muestra la respuesta plana teórica (de 20 Hz a 20 kHz) a la que aspiran la mayoría de los fabricantes de altavoces (rojo oscuro) y la ventana de desviación de ±2 dB que generalmente se considera aceptable (rojo claro).


El predominio de la escucha por altavoz antes del auge de la escucha con auriculares significa que nuestra impresión de cómo suena una respuesta de frecuencia plana ha sido sesgada por la contribución de la acústica de la sala de escucha, hasta el punto de que, en comparación, un par de auriculares con una respuesta de frecuencia plana sonará excesivamente brillante y al mismo tiempo carecerá de energía de baja frecuencia. En comparación con los monitores, el sonido de los auriculares no recibe la atenuación de alta frecuencia que se produce cuando el sonido pasa a través del aire junto con la absorción por los muebles de la habitación (de ahí el brillo excesivo), y no recibe la baja frecuencia de los modos resonantes de la sala de escucha (de ahí la falta de bajas frecuencias).

Debido a estas diferencias, los auriculares contemporáneos no están diseñados para tener una respuesta de frecuencia plana. Más bien, tienen "sonido" (es decir, su respuesta de frecuencia se ha alejado del ideal teórico de "plano") de modo que suenan como altavoces con una respuesta de frecuencia plana. Por lo tanto, vemos a los vendedores de auriculares utilizar frases descriptivas como "tonalidad neutra" y "voz para que suene natural", en lugar de mostrar gráficos de respuesta de frecuencia, porque tales gráficos alarmarían a cualquiera que esperara ver una línea perfectamente recta.

Este es el concepto: comience con un altavoz con una respuesta de frecuencia plana, coloque un micrófono de medición frente a él a la distancia que estaría un oyente típico, realice un barrido de frecuencia a través del altavoz y captúrelo con el micrófono. El resultado es una respuesta de frecuencia "plana" tal como la reproduce el altavoz y la captura en la posición de escucha. Integre esa respuesta de frecuencia en los auriculares y deberían sonar como parlantes con una respuesta de frecuencia plana.

Esto parece bastante simple, pero plantea dudas sobre el tipo de sala que se debe utilizar para tales mediciones porque la acústica de la sala influye en el sonido capturado por el micrófono.


A lo largo de la década de 1970, era una práctica estándar utilizar una cámara anecoica, creando así un entorno de "campo libre" donde el único sonido que llegaba al micrófono era el sonido directo del altavoz sin ninguna contribución de la propia sala (es decir, sin resonancias, sin reflejos y sin reverberación) aparte de la pérdida de altas frecuencias a lo largo de la distancia a través del aire. Esto se conocía como "ecualización de campo libre" y, como era de esperar, los auriculares que utilizan "ecualización de campo libre" suenan más bien como escuchar un altavoz con una respuesta de frecuencia plana colocado en una cámara anecoica. Fue una mejora con respecto al sonido de los auriculares con la respuesta plana teóricamente perfecta, pero aún así no se correlacionó bien con la escucha de los oradores, porque nadie escucha a los oradores en un entorno anecoico. Los diseñadores de auriculares tuvieron la idea correcta, pero aún quedaba trabajo por hacer...

En un intento por crear algo que se correlacionara mejor con los hablantes, en la década de 1980 se introdujo la "ecualización de campo difuso", un método que sigue siendo popular. Un altavoz de 'fuente puntual' (es decir, un altavoz que irradia frecuencias igualmente bien en todas direcciones), con una respuesta de frecuencia plana, se coloca en una cámara de reverberación en lugar de una cámara anecoica. El altavoz reproduce un barrido de frecuencia y lo captura una cabeza simulada colocada a una distancia suficiente para garantizar que se encuentre en el campo difuso (es decir, donde la reverberación de la sala es el sonido dominante). Esta medida proporciona la respuesta de frecuencia que los auriculares deben reproducir. Muchos auriculares aclamados por la crítica y ampliamente adoptados se ajustan a la curva de ecualización de campo difuso.

Más recientemente, las pruebas realizadas por el Dr. Sean Olive y otras personas que trabajan para Harman International (empresa matriz de AKG, Crown, dbx, JBL, Lexicon, Soundcraft) reemplazaron el entorno de campo libre y el entorno de campo difuso con lo que generalmente era considerado una sala de escucha con buen sonido. Luego, los resultados se combinaron con los resultados de pruebas en las que se pidió a numerosos oyentes que hicieran una audición y calificaran sus preferencias por numerosos auriculares con diferentes respuestas de frecuencia. Estas pruebas y mediciones dieron como resultado la curva objetivo de Harman (también conocida como 'Curva de Harman'), como se muestra a continuación:

Harman Curve no es "plano", pero cierra significativamente la brecha de tonalidad entre la reproducción de los auriculares y los altavoces, y proporciona una muy buena traducción tonal entre ellos. Neumann parece haber llevado este enfoque un paso más allá al utilizar sus monitores de la serie KH como altavoces de referencia para dar voz a sus auriculares NDH, lo que dio como resultado auriculares que se correlacionan notablemente bien con sus monitores y minimizan la "línea de mejor ajuste" que ocurre cuando un instrumento en la mezcla suena demasiado alto en un conjunto de monitores pero demasiado bajo en otro conjunto de monitores. Este nivel de correlación entre los monitores y los auriculares es algo que muy pocos fabricantes pueden ofrecer porque la mayoría de los fabricantes de auriculares no fabrican monitores de estudio y la mayoría de los fabricantes de monitores de estudio no fabrican auriculares.

Mezclar con auriculares con sonido de esta manera (es decir, para que suenen como altavoces con una respuesta plana en una buena habitación) generalmente dará como resultado una mejor traducción a la reproducción del altavoz en términos de tonalidad y resuelve una de las principales diferencias entre las mezclas de altavoces y las mezclas de auriculares. Sin embargo, no resuelve las disparidades espaciales como los niveles de panorámica y reverberación, y no contrarresta los efectos de la diafonía interaural. Resolver y/o compensar esos problemas requiere un enfoque más estratégico...



Compensación de panorámica

Como se mencionó anteriormente, escuchar al hablante crea una imagen estéreo que puede tener hasta 60° de ancho (±30°, con 0° directamente frente al oyente). Un sonido panoramizado hacia la izquierda debería aparecer a 30° a la izquierda del centro (es decir, viniendo directamente del monitor de estudio izquierdo), y un sonido panoramizado hacia la derecha debería aparecer a 30° a la derecha del centro (es decir, viniendo directamente desde el monitor de estudio derecho).

En comparación, escuchar con auriculares crea una imagen estéreo que puede tener un ancho de hasta 180° (±90°), dependiendo ligeramente de la ubicación de los controladores dentro de los auriculares. Un sonido que se desplaza completamente hacia la izquierda estará a 90° a la izquierda del centro (procedente directamente del auricular izquierdo) y un sonido que se desplaza completamente a la derecha estará a 90° a la derecha del centro (proviene directamente del oído derecho).

La diferencia entre los anchos de sus escenarios sonoros estéreo se puede representar como una proporción de 180:60, o 3:1, lo que significa que el ancho del escenario sonoro de una mezcla de auriculares debe ser aproximadamente 3 veces más ancho de lo que se espera que sea cuando se escucha a través de los altavoces. Esta es una consideración importante al mezclar con auriculares, porque un sonido panoramizado a 45° hacia la izquierda del centro cuando se escucha con auriculares se escuchará a 45°/3 = 15° hacia la izquierda cuando se escucha a través de los altavoces.

Aunque la monitorización con auriculares exagera la panorámica en comparación con la monitorización de los altavoces, ambos sistemas de monitorización restan importancia a las posiciones de panorámica en comparación con la ubicación visual indicada por el potenciómetro de panorámica, que gira en un rango de 270° (±135°). Las relaciones de panorama entre el potenciómetro, los auriculares y los monitores de estudio son, por tanto, 270:180:60 o 4,5:3:1. Desde el punto de vista de un ingeniero de mezcla sentado en el punto óptimo del estéreo, se verá una panorámica izquierda dura a 135° hacia la izquierda en el potenciómetro de panorámica, pero se escuchará a 90° hacia la izquierda en los auriculares y se escuchará a 30°. ° hacia la izquierda a través de monitores de estudio. (Para aumentar la confusión, se mostrará a 45° a la izquierda en un goniómetro , pero hablaremos de eso más adelante...)


Para cualquier auricular, siempre es un buen procedimiento comenzar una mezcla estableciendo la ubicación de cinco puntos de referencia en todo el escenario sonoro estéreo (izquierda extrema, mitad izquierda, centro, mitad derecha, extrema derecha) y recordarnos dónde están esas ubicaciones. Esto es especialmente importante si somos nuevos en la mezcla con auriculares y realizamos una panorámica intuitiva de los sonidos de oído en las mismas ubicaciones a las que estamos acostumbrados a escucharlos cuando los mezclamos a través de los altavoces. Esto dará como resultado un escenario sonoro muy estrecho cuando se escuche en los monitores porque la reproducción de los monitores reduce el ancho de la mezcla de auriculares en un factor de 3:1, como se mencionó anteriormente.

Recuerde, el escenario sonoro estéreo de los auriculares es aproximadamente 3 veces más ancho que el de los altavoces. Por lo tanto, si desea que un sonido aparezca 15° hacia la izquierda (es decir, en el centro de la izquierda) cuando se escucha a través de los altavoces, debe realizar una panorámica de 45° hacia la izquierda (es decir, 3 x 15°) si lo mezcla con auriculares.

Un aspecto interesante de la mezcla con auriculares relacionado con la panorámica es la ubicación del "centro". Dependiendo de los auriculares y del oyente, el "centro" a menudo parece estar dentro de la cabeza del oyente o directamente encima de ella. Para superar este problema, muchos diseños de auriculares contemporáneos utilizan controladores en ángulo y/o almohadillas en ángulo para colocar los controladores ligeramente por delante del canal auditivo. Esto permite que los pabellones auriculares creen ISD sutiles que colocan el escenario sonoro frente al oyente, a expensas de una reducción menor en el ancho del escenario sonoro estéreo.



Compensación de reverberación

Cada sala de mezclas bien diseñada se ajusta a una curva de reverberación que garantiza un nivel de reverberación de fondo que representa un entorno de escucha idealizado del mundo real. Entre otras cosas, esto crea una 'referencia de reverberación' para equilibrar los niveles y tiempos de nuestros efectos de reverberación, asegurando que no sean significativamente más bajos, más altos, más largos o más cortos de lo previsto cuando la mezcla se saca de la sala y se reproduce en el mundo real.

Comúnmente se cree que si mezclamos en una sala que no tiene suficiente reverberación propia, agregaremos demasiada reverberación a nuestras mezclas para compensar. El mismo pensamiento implica que si mezclamos en una sala que tiene demasiada reverberación propia, no agregaremos suficiente reverberación a nuestras mezclas. Aunque esto parece tener sentido, ignora la notable capacidad del oído/cerebro para distinguir entre la reverberación de la sala de mezclas y la reverberación añadida a la mezcla. La reverberación de la sala de mezclas no necesariamente se escucha como parte de la reverberación de la mezcla, pero proporciona un efecto de enmascaramiento que la reverberación en nuestras mezclas debe superar. El resultado es el siguiente…

Si mezclamos a través de altavoces en una sala que tiene una referencia de reverberación particularmente baja, es posible que los niveles de los efectos de reverberación que agreguemos a la mezcla no sean lo suficientemente altos porque se escuchan fácilmente por encima de la referencia de reverberación de la sala. Del mismo modo, los tiempos de reverberación que elegimos pueden ser demasiado cortos porque la baja referencia de reverberación de la sala hace que sea más fácil escuchar las colas de reverberación añadidas durante más tiempo.

De manera similar, si mezclamos a través de altavoces en una sala que tiene una referencia de reverberación particularmente alta, los niveles de los efectos de reverberación que agreguemos a nuestra mezcla podrían ser demasiado altos para que se escuchen por encima de la referencia de reverberación alta de la sala. Del mismo modo, los tiempos de reverberación que elijamos pueden ser demasiado largos porque la alta referencia de reverberación de la sala hace que sea más difícil escuchar las colas de reverberación añadidas durante el tiempo deseado.

La siguiente ilustración ilustra este problema. El gráfico superior muestra la reverberación (verde) que se agrega a una mezcla en tres salas de mezcla diferentes: una con una referencia de reverberación muy baja, otra con una buena referencia de reverberación y otra con una referencia de reverberación muy alta. El nivel de referencia de reverberación de cada habitación se muestra en gris y, en cada caso, la reverberación mixta (verde) se ha agregado en un nivel y duración apropiados para lograr el mismo nivel percibido y duración en cada habitación, representado por el área verde sobre las áreas grises. .


El gráfico inferior muestra lo que sucede cuando cada mezcla se reproduce en una sala con una buena referencia de reverberación. La reverberación de la primera mezcla es inaudible, lo que da como resultado una mezcla muy "seca". La segunda mezcla es consistente con el gráfico superior. La reverberación de la tercera mezcla es demasiado alta, lo que da como resultado una mezcla muy "húmeda".

La escucha con auriculares no se ve afectada por la acústica de la sala de mezclas y, por lo tanto, no tiene referencia de reverberación, lo que dificulta juzgar y establecer niveles y tiempos de reverberación de una manera que se traduzca bien en los altavoces. Una mezcla realizada completamente a través de monitores en una sala de mezclas diseñada acústicamente se traduce en auriculares sin sorpresas en los niveles o tiempos de reverberación porque los efectos de reverberación se han equilibrado con la referencia de reverberación de la sala. Sin embargo, una mezcla realizada íntegramente a través de auriculares podría tener cambios sorprendentes en los niveles de reverberación cuando se escuche a través de altavoces porque se ha realizado sin referencia de reverberación. Lo que suena "bien" cuando se mezcla con auriculares suele ser demasiado bajo cuando se escucha a través de los altavoces.

Podemos resolver el problema de la referencia de reverberación al mezclar con auriculares utilizando una pista de referencia como prueba de la realidad, de la que hablaremos más en la próxima entrega.



Compensación de diafonía interaural

Al mezclar con auriculares no podemos predecir qué cambios ocurrirán en nuestra mezcla cuando las señales izquierda y derecha se combinen en el aire y en los oídos. Como se mencionó anteriormente, esto se conoce como "diafonía interaural" y es una parte inevitable de la monitorización del altavoz: parte de la señal del canal izquierdo ingresará al oído derecho y parte de la señal del canal derecho ingresará al oído izquierdo.

La diafonía interaural puede afectar los niveles percibidos y la panorámica de instrumentos individuales en nuestra mezcla estéreo, puede introducir filtrado de peine y puede alterar el nivel percibido de reverberación y efectos estéreo similares basados ​​en el tiempo.

La forma más sencilla de comprobar los efectos de la diafonía interaural al mezclar con auriculares es comprobar la mezcla en mono. Esto crea un escenario de diafonía en el "peor de los casos" (es decir, ambos canales se suman completamente) que exagerará cualquier cambio de nivel o problemas de filtrado combinado que puedan ocurrir cuando la mezcla se escuche a través de los parlantes. Es de esperar que se produzcan cambios sutiles en los niveles de señal individuales dentro de la balanza, pero también pueden ser indicadores de debilidades ocultas en la mezcla que vale la pena abordar y ajustar. Por ejemplo, los sonidos en la mezcla estéreo que se vuelven demasiado altos o demasiado bajos cuando se monitorean en mono probablemente no estén en el nivel correcto en la mezcla estéreo y deben ajustarse en consecuencia. Una mezcla de auriculares que suena aceptable cuando se monitorea en estéreo y aceptable cuando se monitorea en mono tiene muchas posibilidades de sonar aceptable también cuando se escucha a través de los parlantes.

Otra herramienta útil para revelar posibles problemas de diafonía interaural en una mezcla de auriculares es el goniómetro , también conocido como medidor de correlación, un accesorio popular en las antiguas películas de ciencia ficción. Más sobre esa útil herramienta en la próxima entrega...


By Greg Simmons

Tags:

Publicar un comentario

0Comentarios

Publicar un comentario (0)

#buttons=(Ok, adelante!) #days=(20)

Nuestro sitio web utiliza cookies para mejorar su experiencia. Aprender más
Ok, Go it!