Además de para percibir la dirección del sonido, el oído y el cerebro se combinan para percibir la distancia y un sentido del espacio acústico en el que el sonido ocurre.
Cuando se genera un sonido, se propaga desde la fuente en todas direcciones simultáneamente. Un porcentaje del sonido alcanza al oyente directamente, sin encontrar obstáculos. Una porción mucho más grande, sin embargo, se propagará hacia las muchas superficies de un recinto acústico. Si estas superficies son reflexivas, las ondas sonoras rebotaran en la habitación, donde algunas de estas reflexiones alcanzarán al oyente. Si las superficies son absorbentes, muy poca energía se reflejará hacia el oyente. En el aire, el sonido viaja a una velocidad constante de aproximadamente 1130 pies por segundo, de modo que la onda que viaja en línea recta desde la fuente hasta el oyente sigue el camino más corto y llega primero al oído del oyente. Esto se llama sonido directo. Aquellas ondas que rebotan en las superficies deben viajar más lejos para llegar al oyente y, por tanto, llegan después del sonido directo. Estas ondas forman lo que se llama el sonido reflejado que, además de estar retrasado, puede llegar de direcciones distintas que el sonido directo.
Como resultado de estas longitudes de recorrido más largas, el oído oye el sonido incluso después de que la fuente haya dejado de emitirlo. Las superficies altamente reflexivas absorben menos energía de las ondas en cada reflexión y permiten que el sonido persista más tiempo, después de que la fuente haya dejado de emitirlo, que las superficies altamente absorbentes que disipan la energía de la onda. El sonido oído en una habitación puede dividirse en tres categorías que tienen lugar sucesivamente: sonido directo, las primeras reflexiones y la reverberación.
El sonido directo determina nuestra percepción de la localización y tamaño de la fuente de sonido y lleva el autentico timbre de la fuente. La cantidad de absorción que tiene lugar cuando el sonido se refleja en una superficie no es igual a todas las frecuencias. Como resultado, el timbre del sonido reflejado es alterado por las características de la superficie con la que se encuentra.
Las primeras reflexiones alcanzan el oído 50 mseg después que el sonido directo. Estas reflexiones son el resultado de las ondas que encontraron solo unos pocos obstáculos antes de alcanzar al oyente, y pueden llegar de direcciones diferentes que el sonido directo. El tiempo transcurrido entre la percepción del sonido directo y el principio de las primeras reflexiones proporcionan información sobre el tamaño de la habitación, ya que cuanto más lejos del oyente estén las superficies, más tardará el sonido en alcanzarlas y ser reflejadas hacia el oyente. El fenómeno psicoacústico conocido como prioridad o efecto Haas suprime nuestra percepción de estas reflexiones en un rango de 8 a 12 dB, dependiendo del tiempo que tarden en llegar después del sonido directo. El efecto de prioridad se aplica de igual modo tanto si consideramos una fuente de sonido y su reflejada como dos fuentes de sonido espacialmente separadas, tales como dos altavoces, produciendo el mismo sonido; el sonido parecerá originarse en la primera fuente incluso si la fuente retrasada es de 8 a 12 dB más alta.
Otro aspecto del efecto de prioridad es llamado fusión temporal. Las primeras reflexiones que llegan al oyente a los 30 mseg del sonido directo no solo son suprimidas en audibilidad sino que también se funden con el sonido directo. El oído no puede distinguir separadamente los sonidos cercanos y considera las reflexiones como parte del sonido directo. El límite de tiempo de 30 mseg para la fusión temporal no es absoluto, más bien depende del sonido. La fusión desaparece a los 4 mseg para golpecitos secos transitorios, mientras que puede extenderse más allá de los 80 mseg para sonido que cambian lentamente tales como pasajes de legato de violín. A pesar del hecho de que las primeras reflexiones se suprimen y funden con el sonido directo, modifican nuestra percepción del sonido, haciéndolo más alto y lleno.
Los sonidos que alcanzan al oyente más de 50 mseg después que el sonido directo, han sido reflejados desde tantas superficies distintas que empiezan a alcanzar al oyente en un flujo virtualmente continuo y desde todas direcciones. Estas reflexiones densamente espaciadas se llaman reverberaciones. La reverberación se caracteriza por su descenso gradual en amplitud y por la calidez y cuerpo que da al sonido así como el volumen que le da al sonido. Debido a que sufre múltiples reflexiones, el timbre de la reverberación se diferencia bastante del timbre del sonido directo, siendo la diferencia más notable la falta de frecuencias altas y el consiguiente énfasis de los graves.
El tiempo que el sonido persistente tarda en alcanzar 60 dB por debajo de su nivel original se llama tiempo de caída o tiempo de reverberación y se abrevia RT. Las características de absorción de la superficie de una pared determinan su tiempo de reverberación. El cerebro percibe el tiempo de reverberación y el timbre de la reverberación y utiliza esta información para formar una opinión sobre la dureza o suavidad de las superficies que le rodean. El volumen del sonido directo percibido por el oído aumenta rápidamente a medida que el oyente se acerca a la fuente, mientras que el volumen de la reverberación se mantiene constante porque está bien distribuida por la habitación. La percepción de la relación entre el volumen del sonido directo y el volumen del sonido reflejado permite al oyente conocer su distancia a la fuente.
En resumen, el sonido directo proporciona información sobre la localización, tamaño y timbre de la fuente. El tiempo entre la percepción del sonido directo y las primeras reflexiones determinan nuestra impresión sobre el tamaño de la habitación. El tiempo de caída de la reverberación sobre las superficies de la habitación, y la proporción de la reverberación frente al sonido directo determina nuestra percepción de la distancia a la fuente.
Con el uso de unidades de reverberación y retrasos artificiales, el ingeniero puede generar los indicios necesarios para convencer al cerebro de que el sonido se grabó en una Catedral con paredes de piedra cuando de hecho, se grabó en una pequeña habitación. Para hacer esto, el ingeniero envía la señal sin reverberaciones al fader de la consola desde donde se dirige por tres caminos.
Un camino la lleva directamente a los altavoces de monitoreado para producir el sonido directo, mientras que el segundo va a través de una unidad de retraso temporal y después a los altavoces de monitoreado para producir la reverberación. Las salidas de la unidad de reverberación y la primera unidad de retraso temporal se conectan a faders adicionales de la consola, llamados “echo return faders”, para controlar su volumen.
Ajustando el número y la cantidad de retraso en la primera unidad de retraso, el ingeniero puede calcular el tiempo que transcurre entre la recepción del sonido directo y las primeras reflexiones, de modo que determina la percepción del oyente sobre el tamaño de la habitación. La segunda unidad de retraso controla el comienzo de la reverberación; ajustando el tiempo de caída de la unidad de reverberación se determinará la percepción del oyente de las superficies de la habitación. Un largo tiempo de caída indicaría una habitación con superficies duras, mientras que un corto tiempo de caída indicaría una habitación con superficies blandas. Aumentando y disminuyendo la proporción del sonido directo frente a las primeras reflexiones y la reverberación que se oye por medios de los return faders, el oyente puede ser inducido a creer que la fuente de sonido está en la parte delantera o trasera de la habitación que el ingeniero ha creado. Muchas unidades de reverberación proporcionan una salida estéreo de una entrada mono para simular que la reverberación viene de direcciones distintas a la fuente de sonido, como sucede en una habitación real.
A menudo, el doblado o triplicado lo hace el artista solo a través de múltiples sobre doblajes (overdubbing), de modo que un violín puede sonar como un conjunto o de modo que dos vocalistas suenen como un coro. El doblaje también se puede utilizar para reforzar ejecuciones vocales débiles porque las pequeñas irregularidades de una ejecución pueden ser tapadas por la otra. Si el retraso es suficientemente largo (más de 35 mseg) como para que se oiga la repetición. La repetición se suele llamar slip echo o slip back, y hace que el ritmo se doble.