Cepstrum
En el análisis de Fourier, el cepstrum (plural cepstra, adjetivo cepstral) es el resultado de calcular la transformada inversa de Fourier (IFT) del logaritmo de el espectro de señal estimado. El método es una herramienta para investigar estructuras periódicas en espectros de frecuencia. El power cepstrum tiene aplicaciones en el análisis del habla humana.
El término cepstrum se obtuvo invirtiendo las primeras cuatro letras de spectrum. Las operaciones sobre cepstra se denominan análisis de quefrecuencia (o alanisis de quefrecuencia), liftering o análisis cepstral. Puede pronunciarse de las dos formas dadas, teniendo la segunda la ventaja de evitar la confusión con kepstrum.
Origen
El concepto de cepstrum fue introducido en 1963 por B. P. Bogert, M. J. Healy y J. W. Tukey. Sirve como una herramienta para investigar estructuras periódicas en espectros de frecuencia. Dichos efectos están relacionados con ecos perceptibles o reflejos en la señal, o con la aparición de frecuencias armónicas (parciales, sobretonos). Matemáticamente trata el problema de la desconvolución de señales en el espacio de frecuencias.
Las referencias al artículo de Bogert, en una bibliografía, a menudo se editan incorrectamente. Los términos "quefrency", "alanysis", "cepstrum" y "saphe" fueron inventados por los autores reorganizando las letras en frecuencia, análisis, espectro y fase. Los términos inventados se definen de forma análoga a los términos más antiguos.
Definición general
El cepstrum es el resultado de la siguiente secuencia de operaciones matemáticas:
- transformación de una señal desde el dominio del tiempo al dominio de frecuencia
- computación del logaritmo de la amplitud espectral
- transformación a dominio de frecuencia, donde la variable independiente final, la quefrency, tiene una escala de tiempo.
Tipos
El cepstrum se utiliza en muchas variantes. Los más importantes son:
- central: El logaritmo es tomado del " espectro de poder"
- cepstrum complejo: El logaritmo se toma del espectro, que se calcula a través de análisis Fourier
Las siguientes abreviaturas se utilizan en las fórmulas para explicar el cepstrum:
Abreviatura | Explicación |
---|---|
f()t){displaystyle f(t)} | Signal, que es una función del tiempo |
C{displaystyle C} | Cepstrum |
F{displaystyle {fnMithcal}} | Fourier transform: La abreviatura puede soportar i.e. para una transformación continua Fourier, una transformación discreta Fourier (DFT) o incluso un t-transform, ya que el z-transform es una generalización del DFT. |
F− − 1{displaystyle {fnMithcal} {fnK}} {fnMicrosoft} {fn}} {f}} {fnMicrosoft}}}} {fnK}}}} | Inverso de la transformación cuatroier |
log ()x){displaystyle log(x)} | Logaritmo de x. La elección de la base b depende del usuario. En algunos artículos no se especifica la base, otros prefieren la base 10 oe. La elección de la base no tiene ningún impacto en las reglas básicas de cálculo, pero a veces base e conduce a simplificaciones (ver "cepstrum complejo"). |
SilencioxSilencio{displaystyle left WordPressxright sometida} | Valor absoluto, o magnitud de un valor complejo, que se calcula a partir de parte real e imaginaria utilizando el teorema pitagórico. |
SilencioxSilencio2{displaystyle left WordPressxright sometida} {2} | Plaza absoluta |
φ φ {displaystyle varphi } | Ángulo de fase de un valor complejo |
Poder cepstrum
El "cepstrum" se definió originalmente como poder cepstrum por la siguiente relación:
- Cp=SilencioF− − 1{}log ()SilencioF{}f()t)}Silencio2)}Silencio2{displaystyle ¿Qué?
El cepstrum de potencia tiene aplicaciones principales en el análisis de señales de sonido y vibración. Es una herramienta complementaria al análisis espectral.
A veces también se define como:
- Cp=SilencioF{}log ()SilencioF{}f()t)}Silencio2)}Silencio2{displaystyle ¿Por qué?
Debido a esta fórmula, el cepstrum también se denomina a veces el espectro de un espectro. Se puede demostrar que ambas fórmulas son coherentes entre sí ya que la distribución espectral de frecuencias sigue siendo la misma, siendo la única diferencia un factor de escala que se puede aplicar posteriormente. Algunos artículos prefieren la segunda fórmula.
Otras notaciones son posibles debido al hecho de que el logaritmo del espectro de potencia es igual al logaritmo del espectro si se aplica un factor de escala 2:
- log SilencioFSilencio2=2log SilencioFSilencio{displaystyle log Silencio{mathcal {F}tuya}{2}=2log Silencio{mathcal {F}tuvo}}
y por lo tanto:
- Cp=SilencioF− − 1{}2log SilencioFSilencio}Silencio2,o{displaystyle ¿Qué?
- Cp=4⋅ ⋅ SilencioF− − 1{}log SilencioFSilencio}Silencio2,{displaystyle ¿Qué?
que proporciona una relación con el cepstrum real (ver más abajo).
Además, se señalará que la operación final de balanceo en la fórmula para el espectro de potencia Cp{displaystyle C_{p} a veces se llama innecesaria y por lo tanto a veces omitida.
El cepstrum real está directamente relacionado con el cepstrum de potencia:
- Cp=4⋅ ⋅ Cr2{displaystyle C_{p}=4cdot C_{r} {2}
Se deriva del cepstrum complejo (definido a continuación) descartando la información de fase (contenida en la parte imaginaria del logaritmo complejo). Tiene un enfoque en los efectos periódicos en las amplitudes del espectro:
- Cr=F− − 1{}log ()SilencioF{}f()t)}Silencio)}{displaystyle ¿Qué?
Cepstrum complejo
El cepstrum complejo fue definido por Oppenheim en su desarrollo de la teoría de sistemas homomórficos. La fórmula también se proporciona en otra literatura.
- Cc=F− − 1{}log ()F{}f()t)})}{displaystyle ¿Qué?
As F{displaystyle {fnMithcal}} es complejo el plazo de registro también se puede escribir con F{displaystyle {fnMithcal}} como producto de magnitud y fase, y posteriormente como suma. Más simplificación es obvia, si el tronco es un logaritmo natural con basee:
- log ()F)=log ()SilencioFSilencio⋅ ⋅ eiφ φ ){displaystyle log({mathcal {})=log({mathcal {cdot e^{ivarphi }}}}}}
- loge ()F)=loge ()SilencioFSilencio)+loge ()eiφ φ )=loge ()SilencioFSilencio)+iφ φ {displaystyle log _{e}({mthcal {F})=log _{e}({mthcal {fh}})+log _{e}(e^{ivarphi })=log _{e}({m} {mthcal {fh}}})+ivarphi }
Por lo tanto: El cepstrum complejo también se puede escribir como:
- Cc=F− − 1{}loge ()SilencioFSilencio)+iφ φ }{displaystyle ¿Qué?
El cepstrum complejo retiene la información sobre la fase. Por tanto, siempre es posible volver del dominio de la frecuencia al dominio del tiempo mediante la operación inversa:
- f()t)=F− − 1{}b()F{}Cc})},{displaystyle f(t)={mathcal {f} {fnMicrosoft}b^{b^{ethcal Bien.
donde b es la base del logaritmo utilizado.
La principal aplicación es la modificación de la señal en el dominio de la frecuencia (liftering) como operación análoga al filtrado en el dominio de la frecuencia espectral. Un ejemplo es la supresión de efectos de eco mediante la supresión de ciertas frecuencias.
El cepstrum de fase (después del espectro de fase) está relacionado con el cepstrum complejo como
- fase = espectro (cepstrum complejo - reversión de tiempo de cepstrum complejo)2.
Conceptos relacionados
La variable independiente de un gráfico cepstral se denomina quefrency. La quefrecuencia es una medida de tiempo, aunque no en el sentido de una señal en el dominio del tiempo. Por ejemplo, si la frecuencia de muestreo de una señal de audio es de 44100 Hz y hay un gran pico en el cepstrum cuya frecuencia es de 100 muestras, el pico indica la presencia de una frecuencia fundamental que es 44100/100 = 441 Hz. Este pico ocurre en el cepstrum porque los armónicos en el espectro son periódicos y el período corresponde a la frecuencia fundamental, ya que los armónicos son múltiplos enteros de la frecuencia fundamental.
El kepstrum, que significa "Kolmogorov-equation power-series time response", es similar al cepstrum y tiene la misma relación que el valor esperado con el promedio estadístico, es decir, cepstrum es la cantidad medida empíricamente, mientras que kepstrum es la cantidad teórica. Estaba en uso antes del cepstrum.
El autocepstrum se define como el cepstrum de la autocorrelación. El autocepstrum es más preciso que el cepstrum en el análisis de datos con ecos.
Profundizando en el tema del anagrama, un filtro que opera en un cepstrum podría llamarse un levantador. Un elevador de paso bajo es similar a un filtro de paso bajo en el dominio de la frecuencia. Se puede implementar multiplicando por una ventana en el dominio de frecuencia y luego volviendo a convertir al dominio de frecuencia, lo que da como resultado una señal modificada, es decir, con una reducción del eco de la señal.
Interpretación
El cepstrum puede verse como información sobre la tasa de cambio en las diferentes bandas del espectro. Originalmente fue inventado para caracterizar los ecos sísmicos resultantes de terremotos y explosiones de bombas. También se ha utilizado para determinar la frecuencia fundamental del habla humana y para analizar los retornos de señales de radar. La determinación del tono del cepstrum es particularmente efectiva porque los efectos de la excitación vocal (tono) y el tracto vocal (formantes) son aditivos en el logaritmo del espectro de potencia y, por lo tanto, claramente separados.
El cepstrum es una representación utilizada en el procesamiento de señales homomórficas, para convertir señales combinadas por convolución (como una fuente y un filtro) en sumas de sus cepstras, para una separación lineal. En particular, el cepstrum de potencia se usa a menudo como un vector de características para representar la voz humana y las señales musicales. Para estas aplicaciones, el espectro generalmente se transforma primero utilizando la escala de mel. El resultado se denomina cepstrum de frecuencia mel o MFC (sus coeficientes se denominan coeficientes cepstrales de frecuencia mel o MFCC). Se utiliza para la identificación de voz, detección de tono y mucho más. El cepstrum es útil en estas aplicaciones porque la excitación periódica de baja frecuencia de las cuerdas vocales y el filtrado de formantes del tracto vocal, que convolucionan en el dominio del tiempo y se multiplican en el dominio de la frecuencia, son aditivos y en diferentes regiones en el dominio de la frecuencia..
Tenga en cuenta que una onda sinusoidal pura no se puede utilizar para probar el cepstrum para determinar su tono a partir de la quefrecuencia, ya que una onda sinusoidal pura no contiene ningún armónico y no conduce a picos de quefrecuencia. Más bien, se debe usar una señal de prueba que contenga armónicos (como la suma de al menos dos senos donde el segundo seno es algún armónico (múltiplo) del primer seno, o mejor, una señal con forma de onda cuadrada o triangular, como tales señales proporcionar muchos sobretonos en el espectro.).
Una propiedad importante del dominio cepstral es que la convolución de dos señales se puede expresar como la suma de su cepstra compleja:
- x1Alternativa Alternativa x2↦ ↦ x1.+x2..{displaystyle x_{1}*x_{2}mapsto x'_{1}+x'_{2}
Aplicaciones
El concepto de cepstrum ha dado lugar a numerosas aplicaciones:
- tratar con la inferencia de la reflexión (radar, aplicaciones de sonar, sismología de la tierra)
- estimación de la frecuencia fundamental del altavoz (pitch)
- análisis y reconocimiento del discurso
- aplicaciones médicas en análisis de electroencefalograma (EEG) y ondas cerebrales
- análisis de vibración de la máquina basado en patrones armónicos (fallas de la caja, fallas de la hoja de la turbina,...)
Recientemente, se utilizó la deconvolución basada en cepstrum para eliminar el efecto de los trenes de impulsos estocásticos, que originan una señal sEMG, del espectro de potencia de la propia señal sEMG. De esta manera, solo se mantuvo la información sobre la forma y la amplitud del potencial de acción de la unidad motora (MUAP), y luego se utilizó para estimar los parámetros de un modelo de dominio de tiempo del propio MUAP.
Schroeder y Noll propusieron un análisis de cepstrum de corta duración para aplicarlo a la determinación del tono del habla humana.
Contenido relacionado
Búsqueda de interpolación
Wacław Sierpiński
Conjunto contable