Formante

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Espectro de ressonância fonética na produção de fala, ou seu pico

Espectrograma de vogais inglesas americanas Eu... mostrando os formadores F₁ e F₂

Este artigo contém transcrições fonéticas no alfabeto fonético internacional (IPA). Para um guia introdutório sobre símbolos IPA, consulte Ajuda:IPA. Para a distinção entre [ ], / e ⟨), veja IPA Brackets e delimitadores de transcrição.

Na ciência da fala e fonética, um formante é o máximo espectral amplo que resulta de uma ressonância acústica do trato vocal humano. Em acústica, um formante é geralmente definido como um pico amplo, ou máximo local, no espectro. Para sons harmônicos, com essa definição, a frequência do formante às vezes é tomada como aquela do harmônico que é mais aumentado por uma ressonância. A diferença entre essas duas definições reside em se "formantes" caracterizam os mecanismos de produção de um som ou o próprio som produzido. Na prática, a frequência de um pico espectral difere ligeiramente da frequência de ressonância associada, exceto quando, por sorte, os harmônicos estão alinhados com a frequência de ressonância.

Pode dizer-se que uma sala possui formantes característicos dessa sala em particular, devido às suas ressonâncias, ou seja, à forma como o som é refletido nas suas paredes e objetos. Formantes de sala dessa natureza se reforçam enfatizando frequências específicas e absorvendo outras, como explorado, por exemplo, por Alvin Lucier em sua peça I Am Sitting in a Room.

Tanto no discurso como nas salas, os formantes são traços característicos das ressonâncias do espaço. Dizem que eles são excitados por fontes acústicas, como a voz, e moldam (filtram) os sons das fontes, mas não são fontes em si.

História

Do ponto de vista acústico, a fonética tinha um sério problema com a ideia de que o comprimento efetivo do trato vocal mudava as vogais. De fato, quando o comprimento do trato vocal muda, todos os ressonadores acústicos formados pelas cavidades bucais são escalados, assim como suas frequências de ressonância. Portanto, não ficou claro como as vogais podem depender de frequências quando falantes com comprimentos de trato vocal diferentes, por exemplo, baixo e soprano, podem produzir sons que são percebidos como pertencentes à mesma categoria fonética. Tinha que haver alguma maneira de normalizar a informação espectral subjacente à identidade da vogal. Hermann sugeriu uma solução para este problema em 1894, cunhando o termo “formante”. A vogal, segundo ele, é um fenômeno acústico especial, dependente da produção intermitente de um traço especial parcial, ou “formante”, ou “caracteristique”. A frequência do “formante” pode variar um pouco sem alterar o caráter da vogal. Para “e longo” (ee ou iy), por exemplo, o “formante” de frequência mais baixa pode variar de 350 a 440 Hz, mesmo na mesma pessoa.

Fonética

Formantes vogal médios para uma voz masculina
Vogal (IPA)	Formante F₁ (Hz)	Formante F₂ (Hz)	Variação F₁ – F₂ (Hz)
Eu...	240	24:00	2160
Sim.	235	2100	1865
e	390	2300	1910
	370	1900	1530
ɛ	610	1900	1290
O quê?	585	1710	1125
um	850	1610	760
ɶ	820	1530	710
?	750	940	190
ɒ	700	760	60
ʌ	600	1170	570
ɔ	500.	700	200
ɤ	460	1310	850
o	360.	640	280
ɯ	300	1390	1090
u	250	595	345

Os formantes são componentes de frequência distintos do sinal acústico produzido pela fala, instrumentos musicais ou canto. A informação que os humanos precisam para distinguir entre os sons da fala pode ser representada de forma puramente quantitativa pela especificação de picos no espectro de frequência. A maioria desses formantes é produzida por ressonância de tubo e câmara, mas alguns tons de assobio derivam do colapso periódico das zonas de baixa pressão do efeito Venturi.

O formante de menor frequência é chamado F₁, o segundo F₂ e o terceiro F₃. (A frequência fundamental ou tom da voz às vezes é referido como Fá₀, mas não é um formante.) Na maioria das vezes, os dois primeiros formantes, Fá ₁ e F₂, são suficientes para identificar a vogal. A relação entre a qualidade da vogal percebida e as duas primeiras frequências formantes pode ser apreciada ouvindo "vogais artificiais" que são gerados pela passagem de um trem de clique (para simular o trem de pulso glotal) através de um par de filtros passa-banda (para simular ressonâncias do trato vocal).

As consoantes nasais geralmente têm um formante adicional em torno de 2500 Hz. O líquido [l] geralmente tem um formante extra em 1500 Hz, enquanto o Inglês "r" som ([ɹ]) distingue-se por um terceiro formante muito baixo (bem abaixo de 2.000 Hz).

Os plosivos (e, até certo ponto, os fricativos) modificam a colocação dos formantes nas vogais circundantes. Sons bilabiais (como /b/ e /p/ em "bola" ou "sap") causa um rebaixamento dos formantes; em espectrogramas, sons velares (/k/ e /ɡ/ em inglês) quase sempre mostra F₂ e F₃ se unindo em uma 'pitada velar' antes do velar e separando-se do mesmo 'pitada' conforme o velar é liberado; sons alveolares (Inglês /t/ e /d/) causa menos mudanças sistemáticas nos formantes das vogais vizinhas, dependendo parcialmente exatamente de qual vogal está presente. O curso de tempo dessas mudanças nas frequências dos formantes vocálicos é chamado de 'transições dos formantes'.

Na fala vocal normal, a vibração subjacente produzida pelas pregas vocais se assemelha a uma onda dente de serra, rica em sobretons harmônicos. Se a frequência fundamental ou (mais freqüentemente) um dos harmônicos for mais alta que a frequência de ressonância do sistema, então a ressonância será apenas fracamente excitada e o formante geralmente transmitido por essa ressonância será quase todo perdido. Isso é mais aparente no caso de cantoras de ópera soprano, que cantam em tons altos o suficiente para que suas vogais se tornem muito difíceis de distinguir.

O controle das ressonâncias é um componente essencial da técnica vocal conhecida como canto harmônico, no qual o intérprete canta um tom fundamental baixo e cria ressonâncias agudas para selecionar harmônicos superiores, dando a impressão de vários tons sendo cantados ao mesmo tempo.

Espectrogramas podem ser usados para visualizar formantes. Em espectrogramas, pode ser difícil distinguir formantes de harmônicos que ocorrem naturalmente quando se canta. No entanto, pode-se ouvir os formantes naturais em forma de vogal por meio de técnicas atonais, como vocal fry.

Estimativa de formantes

Os formantes, sejam eles vistos como ressonâncias acústicas do trato vocal, ou como máximos locais no espectro da fala, como filtros passa-banda, são definidos por sua frequência e por sua largura espectral (largura de banda).

Existem diferentes métodos para obter esta informação. As frequências formantes, na sua definição acústica, podem ser estimadas a partir do espectro de frequências do som, utilizando um espectrograma (na figura) ou um analisador de espectro. No entanto, para estimar as ressonâncias acústicas do trato vocal (ou seja, a definição de fala dos formantes) a partir de uma gravação de fala, pode-se usar a codificação preditiva linear. Uma abordagem intermediária consiste em extrair o envelope espectral neutralizando a frequência fundamental, e só então procurar por máximos locais no envelope espectral.

Gráficos formantes

Diagrama de formadores de vogal média

Os dois primeiros formantes são importantes na determinação da qualidade das vogais, e é frequentemente dito que correspondem às dimensões de abertura/fechamento (ou baixo/alto) e frente/trás (que têm sido tradicionalmente associadas com a forma e posição de a língua). Assim, o primeiro formante F₁ tem uma frequência mais alta para uma vogal aberta ou baixa, como [a] e uma frequência mais baixa para uma vogal fechada ou alta, como [i] ou [ u]; e o segundo formante F₂ tem uma frequência mais alta para uma vogal anterior como [i] e uma frequência mais baixa para uma vogal posterior como [u].

As vogais quase sempre terão quatro ou mais formantes distinguíveis e, às vezes, mais de seis. No entanto, os dois primeiros formantes são os mais importantes na determinação da qualidade da vogal e são frequentemente plotados um contra o outro em diagramas de vogais, embora essa simplificação falhe em capturar alguns aspectos da qualidade da vogal, como o arredondamento.

Muitos escritores abordaram o problema de encontrar um alinhamento ideal das posições das vogais nos gráficos dos formantes com aquelas do quadrilátero vocálico convencional. O trabalho pioneiro de Ladefoged usou a escala Mel porque esta escala foi reivindicada para corresponder mais de perto à escala auditiva de tom do que à medida acústica da frequência fundamental expressa em Hertz. Duas alternativas para a escala de Mel são a escala de Bark e a escala de taxa ERB. Outra estratégia amplamente adotada é plotar a diferença entre F₁ e F₂ em vez de F₂ no eixo horizontal.

Formante do cantor

Estudos do espectro de frequência de falantes treinados e cantores clássicos, especialmente cantores do sexo masculino, indicam um formante claro em torno de 3000 Hz (entre 2800 e 3400 Hz) que está ausente na fala ou nos espectros de falantes ou cantores não treinados. Acredita-se que esteja associado a uma ou mais ressonâncias superiores do trato vocal. É esse aumento de energia em 3000 Hz que permite que os cantores sejam ouvidos e compreendidos em uma orquestra. Este formante é ativamente desenvolvido através do treinamento vocal, por exemplo, através da chamada voce di strega ou "voz de bruxa" exercícios e é causada por uma parte do trato vocal agindo como um ressonador. Na música clássica e na pedagogia vocal, esse fenômeno também é conhecido como squillo.

Contenido relacionado

Más resultados...