Processamento de sinal de áudio
Processamento de sinal de áudio é um subcampo do processamento de sinal que se preocupa com a manipulação eletrônica de sinais de áudio. Sinais de áudio são representações eletrônicas de ondas sonoras — ondas longitudinais que viajam pelo ar, consistindo em compressões e rarefações. A energia contida nos sinais de áudio é normalmente medida em decibéis. Como os sinais de áudio podem ser representados em formato digital ou analógico, o processamento pode ocorrer em qualquer domínio. Os processadores analógicos operam diretamente no sinal elétrico, enquanto os processadores digitais operam matematicamente em sua representação digital.
História
A motivação para o processamento de sinais de áudio começou no início do século 20 com invenções como o telefone, fonógrafo e rádio que permitiam a transmissão e armazenamento de sinais de áudio. O processamento de áudio era necessário para as primeiras transmissões de rádio, pois havia muitos problemas com os links do estúdio para o transmissor. A teoria do processamento de sinal e sua aplicação ao áudio foi amplamente desenvolvida no Bell Labs em meados do século XX. Os primeiros trabalhos de Claude Shannon e Harry Nyquist sobre teoria da comunicação, teoria da amostragem e modulação de código de pulso (PCM) estabeleceram as bases para o campo. Em 1957, Max Mathews se tornou a primeira pessoa a sintetizar áudio de um computador, dando origem à música de computador.
Os principais desenvolvimentos em codificação de áudio digital e compressão de dados de áudio incluem modulação de código de pulso diferencial (DPCM) por C. Chapin Cutler no Bell Labs em 1950, codificação preditiva linear (LPC) por Fumitada Itakura (Universidade de Nagoya) e Shuzo Saito (Nippon Telegraph and Telephone) em 1966, DPCM adaptável (ADPCM) por P. Cummiskey, Nikil S. Jayant e James L. Flanagan no Bell Labs em 1973, transformação discreta de cosseno (DCT) codificada por Nasir Ahmed, T. Natarajan e K. R. Rao em 1974, e modificação da codificação discreta de cosseno (MDCT) por J. P. Princen, A. W. Johnson e A. B. Bradley na Universidade de Surrey em 1987. LPC é a base para a codificação perceptual e é amplamente usada na codificação de fala, enquanto a codificação MDCT é amplamente usada em formatos modernos de codificação de áudio, como MP3 e Advanced Audio Coding (AAC).
Sinais analógicos
Um sinal de áudio analógico é um sinal contínuo representado por uma tensão ou corrente elétrica que é análoga às ondas sonoras no ar. O processamento de sinal analógico envolve a alteração física do sinal contínuo, alterando a tensão ou corrente ou carga por meio de circuitos elétricos.
Historicamente, antes do advento da tecnologia digital generalizada, o analógico era o único método para manipular um sinal. Desde aquela época, à medida que os computadores e softwares se tornaram mais capazes e acessíveis, o processamento de sinal digital tornou-se o método de escolha. No entanto, em aplicações musicais, a tecnologia analógica ainda é desejável, pois muitas vezes produz respostas não lineares que são difíceis de replicar com filtros digitais.
Sinais digitais
Uma representação digital expressa a forma de onda de áudio como uma sequência de símbolos, geralmente números binários. Isso permite o processamento de sinal usando circuitos digitais, como processadores de sinal digital, microprocessadores e computadores de uso geral. A maioria dos sistemas de áudio modernos usa uma abordagem digital, pois as técnicas de processamento de sinal digital são muito mais poderosas e eficientes do que o processamento de sinal de domínio analógico.
Aplicativos
Métodos de processamento e áreas de aplicação incluem armazenamento, compressão de dados, recuperação de informações musicais, processamento de fala, localização, detecção acústica, transmissão, cancelamento de ruído, impressão digital acústica, reconhecimento de som, síntese e aprimoramento (por exemplo, equalização, filtragem, compressão de nível, remoção ou adição de eco e reverberação, etc.).
Transmissão de áudio
O processamento de sinal de áudio é usado ao transmitir sinais de áudio para aumentar sua fidelidade ou otimizar a largura de banda ou a latência. Neste domínio, o processamento de áudio mais importante ocorre imediatamente antes do transmissor. O processador de áudio aqui deve evitar ou minimizar a supermodulação, compensar transmissores não lineares (um problema potencial com transmissão de ondas médias e curtas) e ajustar o volume geral para o nível desejado.
Controle de ruído ativo
O controle de ruído ativo é uma técnica projetada para reduzir o som indesejado. Ao criar um sinal idêntico ao ruído indesejado, mas com polaridade oposta, os dois sinais se cancelam devido à interferência destrutiva.
Síntese de áudio
Síntese de áudio é a geração eletrônica de sinais de áudio. Um instrumento musical que realiza isso é chamado de sintetizador. Os sintetizadores podem imitar sons ou gerar novos. A síntese de áudio também é usada para gerar a fala humana usando a síntese de fala.
Efeitos de áudio
Os efeitos de áudio alteram o som de um instrumento musical ou outra fonte de áudio. Efeitos comuns incluem distorção, freqüentemente usada com guitarra elétrica em blues elétrico e rock; efeitos dinâmicos como pedais de volume e compressores, que afetam o volume; filtros como pedais wah-wah e equalizadores gráficos, que modificam faixas de frequência; efeitos de modulação, como chorus, flangers e phasers; efeitos de afinação, como pitch shifters; e efeitos de tempo, como reverb e delay, que criam sons de eco e emulam o som de diferentes espaços.
Músicos, engenheiros de áudio e produtores musicais usam unidades de efeitos durante apresentações ao vivo ou no estúdio, geralmente com guitarra elétrica, baixo, teclado eletrônico ou piano elétrico. Embora os efeitos sejam usados com mais frequência com instrumentos elétricos ou eletrônicos, eles podem ser usados com qualquer fonte de áudio, como instrumentos acústicos, bateria e vocais.
Audição de computador
A audição do computador (CA) ou a escuta da máquina é o campo geral do estudo de algoritmos e sistemas para a compreensão de áudio pela máquina. Uma vez que a noção do que significa para uma máquina "aqui" é muito ampla e um tanto vaga, a audição de computador tenta reunir várias disciplinas que originalmente lidavam com problemas específicos ou tinham uma aplicação concreta em mente. O engenheiro Paris Smaragdis, entrevistado em Revisão de tecnologia, fala sobre esses sistemas - "software que usa som para localizar pessoas que se movem através de salas, monitorar máquinas para intermináveis quebras, ou ativar câmeras de tráfego para gravar acidentes."
Inspirado por modelos de audição humana, a CA lida com questões de representação, transdução, agrupamento, uso de conhecimento musical e semântica sonora geral com o objetivo de realizar operações inteligentes em sinais de áudio e música pelo computador. Tecnicamente, isso requer uma combinação de métodos dos campos de processamento de sinais, modelagem auditiva, percepção musical e cognição, reconhecimento de padrões e aprendizado de máquina, bem como métodos mais tradicionais de inteligência artificial para representação de conhecimento musical.Contenido relacionado
História do hardware de computação
Driver do dispositivo
DKW