Escala de mel

Ajustar Compartir Imprimir Citar
Escala conceptual
Parcelas de la escala de mel de campo versus la escala Hertz
A440 Jugar440 Hz = 549,64 mels

La escala de mel (después de la palabra melodía) es una escala perceptiva de tonos juzgados por los oyentes como iguales en distancia entre sí. El punto de referencia entre esta escala y la medición de frecuencia normal se define asignando un tono perceptible de 1000 mels a un tono de 1000 Hz, 40 dB por encima del umbral del oyente. Por encima de los 500 Hz, los oyentes juzgan que los intervalos cada vez más grandes producen incrementos de tono iguales.

Fórmula

Una fórmula para convertir f hercios en m mels es:

m=2595log10⁡ ⁡ ()1+f700){displaystyle m=2595log _{10}left(1+{frac {f}right)}

Historia y otras fórmulas

La fórmula del libro de O'Shaughnessy se puede expresar con diferentes bases logarítmicas:

m=2595log10⁡ ⁡ ()1+f700)=1127In⁡ ⁡ ()1+f700){displaystyle m=2595log _{10}left(1+{frac {f}{700}right)=1127ln left(1+{frac {f}right)}}

Las expresiones inversas correspondientes son:

f=700()10m2595− − 1)=700()em1127− − 1){displaystyle f=700left(10^{frac {m}{2595}-1right)=700left(e^{frac} {m}{1127}}-1right)}

Había curvas y tablas publicadas sobre escalas de tonos psicofísicos desde 1937 de Steinberg curvas basadas en diferencias de tono apenas perceptibles. Pronto siguieron más curvas en 1937 de Fletcher y Munson y Fletcher's 1938 y Stevens' 1937 y 1940 de Stevens y Volkmann documentos utilizando una variedad de métodos experimentales y enfoques de análisis.

En 1949, Koenig publicó una aproximación basada en segmentos lineales y logarítmicos separados, con una ruptura a 1000 Hz.

Gunnar Fant propuso la popular fórmula lineal/logarítmica actual en 1949, pero con la frecuencia de esquina de 1000 Hz.

Fant (1968) menciona una expresión alternativa de la fórmula, que no depende de la elección de la base del logaritmo:

m=1000log⁡ ⁡ 2log⁡ ⁡ ()1+f1000){displaystyle m={frac {1000}log 2}log left(1+{frac {f}{1000}right)right }

En 1976, Makhoul y Cosell publicaron la versión ahora popular con la frecuencia de esquina de 700 Hz. Como Ganchev et al. han observado, "Las fórmulas [con 700], en comparación con [Fant's con 1000], proporcionan una aproximación más cercana a la escala Mel para frecuencias por debajo de 1000 Hz, al precio de una mayor inexactitud para frecuencias superiores a 1000 Hz." Por encima de 7 kHz, sin embargo, la situación se invierte y la versión de 700 Hz vuelve a encajar mejor.

Los datos que motivan algunas de estas fórmulas están tabulados en Beranek (1949), medidos a partir de las curvas de Stevens y Volkmann:

Beranek 1949 datos de escala de mel de Stevens y Volkmann 1940
Hz 20160394670100014201900245031204000510066009.00014000
mel 02505007501000125015001750200022502500275030003250

Lindsay & normando (1977); la fórmula no aparece en su primera edición de 1972:

m=2410log10⁡ ⁡ ()0,0016f+1){displaystyle m=2410log _{10}(0.0016f+1)}

Para comparación directa con otras fórmulas, esto es equivalente a:

m=2410log10⁡ ⁡ ()1+f625){displaystyle m=2410log _{10}left(1+{frac {f}right)}

La mayoría de las fórmulas de escala de mel dan exactamente 1000 mels a 1000 Hz. La frecuencia de corte (por ejemplo, 700 Hz, 1000 Hz o 625 Hz) es el único parámetro libre en la forma habitual de la fórmula. Algunas fórmulas de escala de frecuencia auditiva que no son mel usan la misma forma pero con una frecuencia de interrupción mucho más baja, no necesariamente mapeándose a 1000 a 1000 Hz; por ejemplo, la escala de tasas ERB de Glasberg & Moore (1990) utiliza un punto de quiebre de 228,8 Hz, y el mapa de lugares de frecuencia coclear de Greenwood (1990) utiliza 165,3 Hz.

Umesh et al. han explorado otras formas funcionales para la escala de mel; señalan que las fórmulas tradicionales con una región logarítmica y una región lineal no se ajustan a los datos de las curvas de Stevens y Volkmann, así como a algunas otras formas, con base en la siguiente tabla de datos de mediciones que realizaron a partir de esas curvas:

Umesh et al. 1999 datos de escala de mel de Stevens y Volkmann 1940
Hz 401612004046938671000202230003393410955266500774312000
mel 43257300514771928100015422000214223142600277129143228

Crítica

Stevens' El estudiante Donald D. Greenwood, que había trabajado en los experimentos de la escala de mel en 1956, considera que la escala está sesgada por fallas experimentales. En 2009 publicó en una lista de correo,

Preguntaría, ¿por qué usar la escala Mel ahora, ya que parece ser parcial? Si alguien quiere una escala de Mel debe hacerlo, controlando cuidadosamente el sesgo del orden y utilizando muchos temas –más que en el pasado – y utilizando tanto músicos como no músicos para buscar cualquier diferencia en el rendimiento que pueda ser gobernada por diferencias músico/no musical o subjetivas en general.