Formante

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Espectrograma de las vocales inglesas americanas [i, u, grup] mostrando los formantes F1 y F2

En la ciencia del habla y la fonética, un formante es el máximo espectral amplio que resulta de una resonancia acústica del tracto vocal humano. En acústica, un formante suele definirse como un pico amplio, o máximo local, en el espectro. Para los sonidos armónicos, con esta definición, la frecuencia del formante a veces se toma como la del armónico más aumentado por una resonancia. La diferencia entre estas dos definiciones reside en si "formantes" caracterizar los mecanismos de producción de un sonido o el propio sonido producido. En la práctica, la frecuencia de un pico espectral difiere ligeramente de la frecuencia de resonancia asociada, excepto cuando, por suerte, los armónicos se alinean con la frecuencia de resonancia.

Se puede decir que una habitación tiene formantes característicos de esa habitación en particular, debido a sus resonancias, es decir, a la forma en que el sonido se refleja en sus paredes y objetos. Los formantes de habitación de esta naturaleza se refuerzan enfatizando frecuencias específicas y absorbiendo otras, como lo explota, por ejemplo, Alvin Lucier en su pieza I Am Sitting in a Room.

Tanto en el habla como en las habitaciones, los formantes son rasgos característicos de las resonancias del espacio. Se dice que están excitados por fuentes acústicas como la voz, y moldean (filtran) los sonidos de las fuentes, pero no son fuentes en sí mismos.

Historia

Desde un punto de vista acústico, la fonética tenía un serio problema con la idea de que la longitud efectiva del tracto vocal cambiaba las vocales. De hecho, cuando cambia la longitud del tracto vocal, todos los resonadores acústicos formados por las cavidades bucales se escalan, al igual que sus frecuencias de resonancia. Por lo tanto, no estaba claro cómo las vocales podrían depender de las frecuencias cuando los hablantes con diferentes longitudes de tracto vocal, por ejemplo, los cantantes de bajo y soprano, pueden producir sonidos que se perciben como pertenecientes a la misma categoría fonética. Tenía que haber alguna forma de normalizar la información espectral que sustenta la identidad de las vocales. Hermann sugirió una solución a este problema en 1894, acuñando el término "formante". Una vocal, según él, es un fenómeno acústico especial, que depende de la producción intermitente de un rasgo especial parcial, o "formante", o "característico". La frecuencia del “formante” puede variar un poco sin alterar el carácter de la vocal. Para "e larga" (ee o iy), por ejemplo, el "formante" de frecuencia más baja puede variar de 350 a 440 Hz incluso en la misma persona.

Fonética

Formantes promedio de vocales para una voz masculina
Vowel
(IPA)
Formant F1
(Hz)
Formant F2
(Hz)
Diferencia
F1F2
(Hz)
i24024002160
Sí.23521001865
e39023001910
ø37019001530
Î61019001290
œ58517101125
a8501610760
ɶ8201530710
Alternativa750940190
.70076060
.6001170570
500700200
ɤ4601310850
o360640280
.30013901090
u250595345

Los formantes son componentes de frecuencia distintivos de la señal acústica producida por el habla, los instrumentos musicales o el canto. La información que los seres humanos necesitan para distinguir entre los sonidos del habla se puede representar de forma puramente cuantitativa especificando picos en el espectro de frecuencia. La mayoría de estos formantes son producidos por resonancia de tubo y cámara, pero algunos tonos de silbato se derivan del colapso periódico de las zonas de baja presión del efecto Venturi.

El formante con la frecuencia más baja se llama F1, el segundo F2, y el tercero F3. (La frecuencia fundamental o el tono de la voz a veces se denominan F0, pero no es un formante). Muy a menudo, los dos primeros formantes, F 1 y F2, son suficientes para identificar la vocal. La relación entre la calidad vocálica percibida y las dos primeras frecuencias formantes se puede apreciar escuchando "vocales artificiales" que se generan pasando un tren de clics (para simular el tren de pulsos glóticos) a través de un par de filtros de paso de banda (para simular resonancias del tracto vocal).

Las consonantes nasales suelen tener una formante adicional alrededor de 2500 Hz. El líquido [l] suele tener un formante extra a 1500 Hz, mientras que el Inglés "r" El sonido ([ɹ]) se distingue por un tercer formante muy bajo (bueno por debajo de 2000 Hz).

Las oclusivas (y, hasta cierto punto, las fricativas) modifican la ubicación de las formantes en las vocales circundantes. Sonidos bilabiales (como /b/ y /p/ en "bola" o "savia") causa una disminución de los formantes; en espectrogramas, sonidos velares (/k/ y /ɡ/ en inglés) casi siempre muestran F2< /sub> y F3 uniéndose en un 'pellizco velar' antes de la velar y separándose del mismo 'pinch' como se suelta el velar; sonidos alveolares (inglés /t/ y /d/) causan menos cambios sistemáticos en los formantes de las vocales vecinas, dependiendo en parte exactamente de qué vocal está presente. El curso temporal de estos cambios en las frecuencias de los formantes de las vocales se conoce como 'transiciones de formantes'.

En el habla de voz normal, la vibración subyacente producida por las cuerdas vocales se asemeja a una onda de diente de sierra, rica en sobretonos armónicos. Si la frecuencia fundamental o (más a menudo) uno de los sobretonos es más alta que la frecuencia de resonancia del sistema, entonces la resonancia se excitará débilmente y la formante normalmente impartida por esa resonancia se perderá en su mayor parte. Esto es más evidente en el caso de las cantantes de ópera soprano, que cantan en tonos lo suficientemente altos como para que sus vocales se vuelvan muy difíciles de distinguir.

El control de las resonancias es un componente esencial de la técnica vocal conocida como canto armónico, en la que el intérprete canta un tono fundamental bajo y crea resonancias agudas para seleccionar los armónicos superiores, dando la impresión de que se cantan varios tonos a la vez.

Se pueden usar espectrogramas para visualizar formantes. En los espectrogramas, puede ser difícil distinguir los formantes de los armónicos naturales cuando uno canta. Sin embargo, uno puede escuchar los formantes naturales en forma de vocal a través de técnicas atonales como vocal fry.

Estimación de formantes

Los formantes, ya sea que se vean como resonancias acústicas del tracto vocal o como máximos locales en el espectro del habla, como filtros de paso de banda, se definen por su frecuencia y por su ancho espectral (ancho de banda).

Existen diferentes métodos para obtener esta información. Las frecuencias formantes, en su definición acústica, se pueden estimar a partir del espectro de frecuencias del sonido, utilizando un espectrograma (en la figura) o un analizador de espectro. Sin embargo, para estimar las resonancias acústicas del tracto vocal (es decir, la definición del habla de los formantes) a partir de una grabación de voz, se puede usar codificación predictiva lineal. Un enfoque intermedio consiste en extraer la envolvente espectral neutralizando la frecuencia fundamental, y solo entonces buscando máximos locales en la envolvente espectral.

Gráficas de formantes

Diagrama de formadores promedio de vocales

Los dos primeros formantes son importantes para determinar la calidad de las vocales, y con frecuencia se dice que corresponden a las dimensiones abierta/cerrada (o baja/alta) y anterior/posterior (que tradicionalmente se han asociado con la forma y la posición de las vocales). la lengua). Así, el primer formante F1 tiene una frecuencia más alta para una vocal abierta o baja como [a] y una frecuencia más baja para una vocal cerrada o alta como [i] o [ u]; y el segundo formante F2 tiene una frecuencia más alta para una vocal anterior como [i] y una frecuencia más baja para una vocal posterior como [u].

Las vocales casi siempre tendrán cuatro o más formantes distinguibles y, a veces, más de seis. Sin embargo, los dos primeros formantes son los más importantes para determinar la calidad de las vocales y, a menudo, se comparan entre sí en los diagramas de vocales, aunque esta simplificación no captura algunos aspectos de la calidad de las vocales, como el redondeo.

Muchos escritores han abordado el problema de encontrar una alineación óptima de las posiciones de las vocales en las gráficas de formantes con las del cuadrilátero de vocales convencional. El trabajo pionero de Ladefoged utilizó la escala de Mel porque se afirmaba que esta escala se correspondía más estrechamente con la escala auditiva del tono que con la medida acústica de la frecuencia fundamental expresada en Hertz. Dos alternativas a la escala Mel son la escala Bark y la escala ERB-rate. Otra estrategia ampliamente adoptada es trazar la diferencia entre F1 y F2 en lugar de F< /i>2 en el eje horizontal.

Formante de la cantante

(feminine)

Los estudios del espectro de frecuencias de hablantes entrenados y cantantes clásicos, especialmente cantantes masculinos, indican un formante claro alrededor de 3000 Hz (entre 2800 y 3400 Hz) que está ausente en el habla o en los espectros de hablantes o cantantes no entrenados. Se cree que está asociado con una o más de las resonancias superiores del tracto vocal. Es este aumento de energía a 3000 Hz lo que permite que los cantantes sean escuchados y entendidos por encima de una orquesta. Este formante se desarrolla activamente a través del entrenamiento vocal, por ejemplo a través de la llamada voce di strega o "voz de bruja" ejercicios y es causado por una parte del tracto vocal que actúa como un resonador. En música clásica y pedagogía vocal, este fenómeno también se conoce como squillo.

Contenido relacionado

Lengua catalana

ELIZA

Bajo sajón

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save