Uno de los pioneros en los estudios sobre la escucha espacial fue John Strutt, conocido como Lord Rayleigh. Hace unos 100 años desarrolló una teoría en la cual hay dos sistemas principales para determinar el azimut o elevación: Diferencias Interaurales de Tiempo (DIT) y las Diferencias Interaurales de Intensidad.
Mapa de navegación:
DII: Diferencias Interaurales de Intensidad.
Las DII se dan principalmente a partir de las diferentes distancias que deben recorrer las ondas para llegar a uno y otro oído, pero también por la sombra acústica producida por la cabeza del individuo (difracción de la onda).
Los sonidos de bajas frecuencias tienen longitudes de onda relativamente grandes con respecto a las dimensiones de la cabeza. El estudio de la difracción determina que cuando la longitud de la onda es suficientemente grande con respecto al obstáculo que encuentra la onda, ésta se difracta fácilmente y no se genera una "sombra acústica" (o, al menos, se produce una sombra acústica pequeña). Por el contrario, cuando las longitudes de onda son pequeñas, se produce poca difracción y por lo tanto existe una sombra acústica mayor.
Se puede demostrar que para frecuencias por debajo de los 1000 Hz la intensidad de las ondas sonoras que van desde la fuente sonora a un oído de un observador, difieren de las que llegan al otro oído en una cantidad despreciable. Si tenemos en cuenta consideraciones sólo de intensidad, sería imposible distinguir la dirección de llega de las ondas sonoras. Sin embargo, para altas frecuencias, la cabeza del observador presenta unas características diferentes y la intensidad del sonido en el oído más cercano a la fuente sonora es considerablemente mayor que en el otro oído. Por tanto, para tonos en este rango de frecuencias, podrían sugerir la dirección de la fuente.
Por ejemplo, para frecuencias de 500 Hz la longitud de onda del sonido es de unos 69 cm, unas tres veces el diámetro promedio de una cabeza humana. La difracción es poca. Para frecuencias de 4 kHz (longitud de onda del orden de los 8.5 cm) la sombra acústica es importante.
Por tanto la cabeza será un obstáculo efectivo para las frecuencias
altas y no para el paso de las frecuencias bajas, es decir, la cabeza se comporta
como un filtro acústico paso bajo. Se ha demostrado que para una frecuencia
de 250 Hz, la sonoridad en ambos oídos es prácticamente la misma,
sin importar donde esté situado el foco sonoro. En el caso de una frecuencia
de 1000Hz, el oído más cercano a la fuente oye unos 8dB más,
mientras que para 10.000 Hz la cantidad se eleva a los 30 dB.
La figura siguiente es una representación del ángulo lateral en función de las DII:
B.J.C. Moore: An Introduction to the Psychology of hearing
Para sonidos senoidales (tonos puros) las diferencias de tiempo son equivalentes a diferencias de fase entre las ondas sonoras que llegan a cada uno de los dos oídos, dado que para estas ondas se cumple:
La diferencia de fase es tal que no sólo es función de la distancia
entre los oídos y la orientación de la cabeza, sino también
de la longitud de onda de los sonidos. Para tonos puros de muy baja frecuencia
(es decir, de gran longitud de onda) la diferencia de fase entre el sonido recibido
por los dos oídos es una fracción de la longitud de onda comparativamente
pequeña, aunque un oído gire directamente hacia la fuente sonora.
Por ejemplo, si la distancia entre los dos oídos es aproximadamente 20
cm, esta distancia es sólo el 3% de la longitud de onda para una frecuencia
de 50 Hz. Es difícil que una fracción tan pequeña se pueda
observar. A medida que aumenta la frecuencia, disminuye la longitud de onda
con lo que aumenta la diferencia de fase. Para una frecuencia de 800 Hz, la
separación entre los dos oídos es aproximadamente media longitud
de onda.
Además, puede ocurrir que las diferencias de fase sean tales que haya ciclos enteros de diferencia entre uno y otro oído, y nuestro sistema auditivo no tiene forma de determinar cuál ciclo corresponde a cuál en uno y otro oído.
La ambigüedad comienza a ocurrir a partir de frecuencias cuya mitad de longitud de onda sea la dimensión del diámetro de la cabeza, que como ya hemos mencionado corresponden a frecuencias de aproximadamente unos 800 Hz (longitud de onda = 43 cm). Un sonido senoidal con esa frecuencia exacta (800 Hz) -o múltiplos enteros de ella- produce una sensación ambigua, dado que las ondas en ambos oídos tienen una diferencia de fase de 180º, por lo que el sistema auditivo no puede establecer si uno está adelantado o atrasado medio ciclo con respecto al otro. Pequeños movimientos de la cabeza pueden ayudar a determinar la localización de la fuente sonora. No obstante las DIT se vuelven totalmente ambiguas para sonidos senoidales con frecuencias superiores a los 1.5 kHz.
Por tanto, para frecuencias altas, resulta ambiguo juzgar la dirección de la fuente sonora basándose sólo en la diferencia de fase entre el sonido percibido por los dos oídos. La localización auditiva por diferencia de fase es definitiva en una banda de frecuencias comprendidas entre los 200 y los 800 Hz.
Las figuras siguientes nos enseñan como se mide el ángulo teniendo en cuenta la diferencia de fase:
B.J.C. Moore: An Introduction to the Psychology of hearing
Las DIT van de 0 s para fuentes sonoras con un ángulo de 0º (exactamente delante del sujeto), hasta cerca de 0.69 ms para fuentes sonoras con un ángulo de 90º. Se muestra en la gráfica siguiente:
B.J.C. Moore: An Introduction to the Psychology of hearing
Lord Rayleigh obtuvo una expresión muy simple para calcular las DIT. Hay que tener en cuenta que el sonido viaja a una velocidad c de unos 343 m/s. Consideró una onda de una fuente lejana que llega a una cabeza esférica, con la dirección determinada por el ángulo lateral. Veamoslo en ela siguiente figura:
http://interface.cipic.ucdavis.edu/CIL_tutorial/3D_psych/azimuth.htm
Claramente, el sonido llega antes al oído derecho, ya que
el sonido debe recorrer una distancia extra
para llegar al oído izquierdo. Dividiendo esta distancia por la velocidad
del sonido, se obtiene una expresión muy simple (y sorprendentemente
precisa) para las DIT:
Vemos que la DIT es cero cuando la fuente está justo delante
y tiene un máximo de
cuando la fuente está en un lado. Esto representa una diferencia de llegada
de tiempo de unos 0.7 ms, para una cabeza humana típica.
Hemos realizado un sencillo programa para simular estas diferencias. Puede obtenerlo aquí
El umbral diferencial en la sensación de dirección es de aproximadamente 5º para sonidos ubicados en el plano frontal, lo que corresponde a una DIT de aproximadamente 50 ms. Esto puede considerarse el umbral diferencial para sonidos senoidales con frecuencias inferiores a los 1.5 kHz. No obstante, se han medido umbrales de entre 30 ms y casi 200 ms, lo que muestra una amplia variación individual en los resultados.
DII de entre 1 y 2 dB producen las mínimas variaciones perceptibles en el desplazamiento de las fuentes sonoras. Otros experimentos han determinado que dicho umbral es de 0.5 dB.
Los sonidos que ocurren en situaciones reales tienen fases de ataque y caída, transitorios y características espectrales particulares. La mayoría también cambia su intensidad y su característica espectral en el tiempo.
Las DIT ya no producen la ambigüedad de los sonidos senoidales, dado que el sistema auditivo compara las DIT (diferencias de fase) entre los distintos filtros auditivos. La DIT común entre los diferentes canales es aceptada como la DIT "correcta".
Experimentos realizados utilizaron tres tipos de sonido:
* ruido de banda limitada, con frecuencias en el rango de 150-1700 Hz;
* sonidos senoidales de 1 kHz con ataques y caídas graduales;
* "clicks" de 1 ms de duración.
Los umbrales de DIT determinados fueron 9 ms, 11 ms y 28 ms respectivamente. Una DIT de 10 ms corresponde a un desplazamiento lateral de 1º.
Los datos más exactos fueron brindados por el ruido, lo que se explicaría en el hecho de que un ruido fluctúa aleatoriamente en el tiempo, ofreciendo información acerca de los transitorios repetidamente a lo largo de la presentación de sonido de referencia.
El "click", por el contrario, es en realidad solamente un transitorio, y brindó los resultados más inexactos.
Es de hacer notar que en estos experimentos los sonidos eran en realidad relativamente largos, de aproximadamente 1.4 s de duración. Para sonidos más cortos la exactitud disminuye.
Pero también, para trenes de "clicks" el umbral de DIT puede disminuir hasta los 10 ms, si la frecuencia del tren es razonablemente baja (unos 200 Hz -clicks por segundo- o menos).
Para sonidos con fases de ataque no impulsivas el umbral de DIT mejora a medida que aumenta la duración del sonido, llegando a ser de 6 ms para duraciones de 700 ms.
Cuando se usan señales de banda limitada suele ocurrir un fenómeno denominado inversión. En esos casos, aunque la fuente sonora está situada delante del sujeto, éste la percibe como ubicada detrás de él. Esto se da en casos extremos como confundir 0º con 180º, pero también puede darse para pasos intermedios. Una fuente sonora situada en un ángulo lateral de 20º puede percibirse como situada a 160º.
Todo lo expuesto anteriormente se ha limitado a tonos puros, y asumiendo también que el observador es incapaz de girar la cabeza con el fin de encontrar el azimut de la fuente. Generalmente estas hipótesis no se dan en la realidad, y por tanto no se puede determinar la dirección de llegada de un sonido ordinario con el alto grado de precisión que se obtienen en los experimentos con tonos puros. La naturaleza compleja de los sonidos, indica que el espectro de frecuencia se extiende sobre la mayor parte del rango audible, por lo que la diferencia entre niveles de intensidad y fases pueden ser utilizadas simultáneamente para localizar el origen del sonido.
En resumen, para frecuencias altas (por encima de los 1000 Hz), la localización se debe fundamentalmente a la intensidad, mientras que para las bajas frecuencias (menos de 800 Hz) la localización que domina es la debida a la diferencia de fases y tiempo de retardos en ambos oídos. En frecuencias medias se presenta una indeterminación que los seres humanos resuelven por medio de una localización tanto por fase como por nivel de intensidad, es decir utilizamos ambas de forma simultánea y combinada. Esta teoría fue denominada "teoría duplex" por Lord Rayleigh en 1907.
Cuando hay una gran incertidumbre, se mueve la cabeza y de esta manera se varía la posición de los oídos respecto al foco sonoro, obteniendo más datos para que el cerebro determine el origen del sonido.