Reducción de ruido
Reducción de ruido es el proceso de eliminar el ruido de una señal. Existen técnicas de reducción de ruido para audio e imágenes. Los algoritmos de reducción de ruido pueden distorsionar la señal hasta cierto punto. El rechazo de ruido es la capacidad de un circuito para aislar un componente de señal no deseado del componente de señal deseado, como ocurre con la relación de rechazo de modo común.
Todos los dispositivos de procesamiento de señales, tanto analógicos como digitales, tienen características que los hacen susceptibles al ruido. El ruido puede ser aleatorio con una distribución de frecuencia uniforme (ruido blanco) o ruido dependiente de la frecuencia introducido por el mecanismo de un dispositivo o algoritmos de procesamiento de señales.
En los sistemas electrónicos, un tipo importante de ruido es el silbido creado por el movimiento aleatorio de los electrones debido a la agitación térmica. Estos electrones agitados se suman y restan rápidamente de la señal de salida y, por lo tanto, crean un ruido detectable.
En el caso de películas fotográficas y cintas magnéticas, el ruido (tanto visible como audible) se introduce debido a la estructura granular del medio. En la película fotográfica, el tamaño de los granos de la película determina la sensibilidad de la película; las películas más sensibles tienen granos de mayor tamaño. En la cinta magnética, cuanto más grandes son los granos de las partículas magnéticas (generalmente óxido férrico o magnetita), más propenso es el medio al ruido. Para compensar esto, se pueden utilizar áreas más grandes de película o cinta magnética para reducir el ruido a un nivel aceptable.
En general
Los algoritmos de reducción de ruido tienden a alterar las señales en mayor o menor grado. El algoritmo de ortogonalización local de señal y ruido se puede utilizar para evitar cambios en las señales.
En exploración sísmica
Aumentar las señales en los datos sísmicos es especialmente crucial para la obtención de imágenes, la inversión y la interpretación sísmicas, lo que mejora en gran medida la tasa de éxito en las investigaciones sobre petróleo y petróleo. exploración de gas. La señal útil que está manchada en el ruido ambiental aleatorio a menudo se descuida y, por lo tanto, puede causar una discontinuidad falsa de eventos sísmicos y artefactos en la imagen migrada final. Mejorar la señal útil y al mismo tiempo preservar las propiedades de los bordes de los perfiles sísmicos atenuando el ruido aleatorio puede ayudar a reducir las dificultades de interpretación y los riesgos engañosos para la detección de petróleo y gas.
En audio
El silbido de la cinta es un problema que limita el rendimiento en la grabación de cintas analógicas. Esto está relacionado con el tamaño de las partículas y la textura utilizadas en la emulsión magnética que se rocía sobre el soporte de grabación, y también con la velocidad relativa de la cinta a lo largo de los cabezales.
Existen cuatro tipos de reducción de ruido: pregrabación de un solo extremo, reducción de silbidos de un solo extremo, reducción de ruido de superficie de un solo extremo y sistemas de códec o de dos extremos. Los sistemas de pregrabación de un solo extremo (como Dolby HX Pro) funcionan para afectar el medio de grabación en el momento de la grabación. Los sistemas de reducción de silbido de un solo extremo (como DNL o DNR) funcionan para reducir el ruido a medida que se produce, incluso antes y después del proceso de grabación, así como para aplicaciones de transmisión en vivo. La reducción de ruido de superficie de un solo extremo (como CEDAR y los anteriores SAE 5000A, Burwen TNE 7000 y Packburn 101/323/323A/323AA y 325) se aplica a la reproducción de discos fonográficos para abordar rayones, estallidos y problemas de superficie. linealidades. Los expansores de rango dinámico de un solo extremo, como el sistema de recuperación de rango dinámico y reducción de ruido del autocorrelador lineal de fase (modelos 1000 y 4000), pueden reducir diversos ruidos de grabaciones antiguas. Los sistemas de doble extremo (como el sistema de reducción de ruido Dolby o dbx) tienen un proceso de preénfasis aplicado durante la grabación y luego un proceso de desacentuación aplicado en
Las grabaciones de sonido digital modernas ya no necesitan preocuparse por el silbido de la cinta, por lo que los sistemas de reducción de ruido de estilo analógico no son necesarios. Sin embargo, un giro interesante es que los sistemas de tramado en realidad añaden ruido a una señal para mejorar su calidad. reproducción.
Sistemas de reducción de ruido basados en Compander
Los sistemas de reducción de ruido con compresor de doble extremo tienen un proceso de preénfasis aplicado durante la grabación y luego un proceso de desénfasis aplicado durante la reproducción. Los sistemas incluyen los sistemas profesionales Dolby A y Dolby SR de Dolby Laboratories, dbx Professional y dbx Type I de dbx, Donald Aldous' EMT NoiseBX, eliminador de ruido Burwen, telecomunicaciones c4 de Telefunken y MXR Innovations' MXR, así como los sistemas de consumo Dolby NR, Dolby B, Dolby C y Dolby S, dbx Type II, High Com de Telefunken y High-Com II de Nakamichi, Toshiba (Aurex AD- 4) dirección, estilo ANRS y Super ANRS, Fisher/Sanyo's Super D, SNRS y Ex-Ko de Hungría/Alemania Oriental sistema.
En algunos sistemas de compresión, la compresión se aplica durante la producción de medios profesionales y el oyente solo aplica la expansión; por ejemplo, sistemas como dbx disc, High-Com II, CX 20 y UC utilizados para grabaciones de vinilo y Dolby FM, High Com FM y FMX utilizados en transmisiones de radio FM.
La primera técnica de reducción de ruido de audio ampliamente utilizada fue desarrollada por Ray Dolby en 1966. Diseñado para uso profesional, Dolby Type A era un sistema de codificación/decodificación en el que la amplitud de las frecuencias en cuatro bandas aumentaba durante la grabación (codificación), luego disminuye proporcionalmente durante la reproducción (decodificación). En particular, al grabar partes silenciosas de una señal de audio, se potenciarían las frecuencias superiores a 1 kHz. Esto tuvo el efecto de aumentar la relación señal-ruido en la cinta hasta 10 dB dependiendo del volumen de la señal inicial. Cuando se reprodujo, el decodificador invirtió el proceso y, de hecho, redujo el nivel de ruido hasta en 10 dB.
El sistema Dolby B (desarrollado en conjunto con Henry Kloss) era un sistema de banda única diseñado para productos de consumo. El sistema Dolby B, aunque no era tan eficaz como Dolby A, tenía la ventaja de seguir siendo escuchable en sistemas de reproducción sin decodificador.
El circuito integrado Telefunken High Com U401BR también podría utilizarse para funcionar como un compresor compatible principalmente con Dolby B. En varias platinas High Com de última generación, la funcionalidad Dolby-B que emulaba D NR Expander funcionaba no sólo durante la reproducción sino, como característica no documentada, también durante la grabación.
dbx era un sistema de reducción de ruido analógico de la competencia desarrollado por David E. Blackmer, fundador de Dbx, Inc. Utilizaba un algoritmo de codificación/decodificación de raíz cuadrática media (RMS) con las frecuencias altas propensas al ruido aumentadas y el toda la señal alimentada a través de un compander 2:1. dbx operaba en todo el ancho de banda audible y, a diferencia de Dolby B, no se podía utilizar sin un decodificador. Sin embargo, podría lograr hasta 30 dB de reducción de ruido.
Dado que las grabaciones de vídeo analógico utilizan modulación de frecuencia para la parte de luminancia (señal de vídeo compuesto en sistemas de color directo), que mantiene la cinta en el nivel de saturación, la reducción de ruido estilo audio es innecesaria.
Limitador de ruido dinámico y reducción de ruido dinámico
ElLimitador de ruido dinámico (DNL) es un sistema de reducción de ruido de audio introducido originalmente por Philips en 1971 para su uso en pletinas de casetes. Su circuito también se basa en un solo chip.
National Semiconductor lo desarrolló aún más como reducción dinámica de ruido (DNR) para reducir los niveles de ruido en la telefonía de larga distancia. Vendido por primera vez en 1981, DNR se confunde frecuentemente con el sistema de reducción de ruido Dolby, mucho más común.
A diferencia de los sistemas de reducción de ruido Dolby y dbx Tipo I y Tipo II, DNL y DNR son sistemas de procesamiento de señal de solo reproducción que no requieren que el material fuente se codifique primero. Se pueden utilizar para eliminar el ruido de fondo de cualquier señal de audio, incluidas grabaciones en cinta magnética y transmisiones de radio FM, reduciendo el ruido hasta en 10 dB. También se pueden usar junto con otros sistemas de reducción de ruido, siempre que se usen antes de aplicar DNR para evitar que DNR cause que el otro sistema de reducción de ruido se desvíe.
Una de las primeras aplicaciones generalizadas de DNR fue en los sistemas estéreo de automóviles GM Delco en automóviles GM de EE. UU. introducidos en 1984. También se usó en equipos de sonido de fábrica en vehículos Jeep en la década de 1980, como el Cherokee XJ. Hoy en día, los sistemas DNR, DNL y similares se utilizan con mayor frecuencia como sistemas de reducción de ruido en sistemas de micrófonos.
Otros enfoques
Una segunda clase de algoritmos funciona en el dominio de tiempo-frecuencia utilizando algunos filtros lineales o no lineales que tienen características locales y a menudo se denominan filtros de tiempo-frecuencia. Por lo tanto, el ruido también se puede eliminar mediante el uso de herramientas de edición espectral, que funcionan en este dominio de tiempo-frecuencia, permitiendo modificaciones locales sin afectar la energía de la señal cercana. Esto se puede hacer manualmente, de forma muy parecida a como se hace en un programa de pintura. Otra forma es definir un umbral dinámico para filtrar el ruido, que se deriva de la señal local, nuevamente con respecto a una región de tiempo-frecuencia local. Todo lo que esté por debajo del umbral se filtrará, todo lo que esté por encima del umbral, como partes de una voz o ruido deseado, quedará intacto. La región normalmente se define por la ubicación de la frecuencia instantánea de la señal, ya que la mayor parte de la energía de la señal que se debe preservar se concentra alrededor de ella.
Programas de software
La mayoría de las estaciones de trabajo de audio digital (DAW) y el software de edición de audio tienen una o más funciones de reducción de ruido.
En imágenes
Las imágenes tomadas con cámaras digitales o cámaras de película convencionales captarán ruido de diversas fuentes. El uso posterior de estas imágenes a menudo requerirá que se reduzca el ruido ya sea con fines estéticos o prácticos, como la visión por computadora.
Tipos
En el ruido de sal y pimienta (perturbaciones escasas de luz y oscuridad), también conocido como ruido impulsivo, los píxeles de la imagen son muy diferentes en color o intensidad de los píxeles circundantes; la característica definitoria es que el valor de un píxel ruidoso no guarda relación con el color de los píxeles circundantes. Generalmente, este tipo de ruido sólo afectará a una pequeña cantidad de píxeles de la imagen. Cuando se ve, la imagen contiene puntos blancos y oscuros, de ahí el término ruido de sal y pimienta. Las fuentes típicas incluyen motas de polvo dentro de la cámara y elementos CCD sobrecalentados o defectuosos.
En el ruido gaussiano, cada píxel de la imagen cambiará de su valor original en una cantidad (normalmente) pequeña. Un histograma, un gráfico de la cantidad de distorsión de un valor de píxel frente a la frecuencia con la que ocurre, muestra una distribución normal de ruido. Si bien son posibles otras distribuciones, la distribución gaussiana (normal) suele ser un buen modelo, debido al teorema del límite central que dice que la suma de diferentes ruidos tiende a aproximarse a una distribución gaussiana.
En cualquier caso, el ruido en diferentes píxeles puede estar correlacionado o no; En muchos casos, los valores de ruido en diferentes píxeles se modelan como independientes y distribuidos de manera idéntica y, por lo tanto, no correlacionados.
Eliminación
Compensaciones
Existen muchos algoritmos de reducción de ruido en el procesamiento de imágenes. Al seleccionar un algoritmo de reducción de ruido, se deben sopesar varios factores:
- la potencia y el tiempo disponibles: una cámara digital debe aplicar reducción de ruido en una fracción de segundo usando una pequeña CPU a bordo, mientras que un ordenador de escritorio tiene mucha más potencia y tiempo
- si sacrificar algún detalle real es aceptable si permite eliminar más ruido (cuán agresivamente decidir si las variaciones en la imagen son ruido o no)
- las características del ruido y el detalle en la imagen, para tomar mejor esas decisiones
Separación de ruido de croma y luminancia
En fotografías del mundo real, el detalle de frecuencia espacial más alta consiste principalmente en variaciones de brillo (detalle de luminancia) en lugar de variaciones de tono (detalle de croma). Dado que cualquier algoritmo de reducción de ruido debe intentar eliminar el ruido sin sacrificar los detalles reales de la escena fotografiada, se corre el riesgo de una mayor pérdida de detalles por la reducción del ruido de luminancia que por la reducción del ruido cromático simplemente porque, para empezar, la mayoría de las escenas tienen pocos detalles cromáticos de alta frecuencia. Además, la mayoría de la gente considera que el ruido cromático en las imágenes es más objetable que el ruido de luminancia; las manchas de colores se consideran de aspecto digital y antinaturales, en comparación con la apariencia granulada del ruido de luminancia que algunos comparan con el grano de una película. Por estas dos razones, la mayoría de los algoritmos de reducción de ruido fotográfico dividen el detalle de la imagen en componentes de croma y luminancia y aplican más reducción de ruido al primero.
La mayoría de los programas informáticos dedicados a la reducción de ruido permiten al usuario controlar la reducción de ruido de croma y luminancia por separado.
Filtros de suavizado lineal
Un método para eliminar el ruido es convolucionar la imagen original con una máscara que represente un filtro de paso bajo o una operación de suavizado. Por ejemplo, la máscara gaussiana comprende elementos determinados por una función gaussiana. Esta convolución acerca el valor de cada píxel a una mayor armonía con los valores de sus vecinos. En general, un filtro de suavizado establece cada píxel en el valor promedio, o un promedio ponderado, de sí mismo y de sus vecinos cercanos; el filtro gaussiano es sólo un posible conjunto de pesos.
Los filtros de suavizado tienden a desenfocar una imagen porque los valores de intensidad de píxeles que son significativamente más altos o más bajos que el vecindario circundante difuminarían el área. Debido a esta confusión, los filtros lineales rara vez se utilizan en la práctica para reducir el ruido; Sin embargo, a menudo se utilizan como base para filtros de reducción de ruido no lineales.
Difusión anisotrópica
Otro método para eliminar el ruido es hacer evolucionar la imagen bajo una ecuación diferencial parcial de suavizado similar a la ecuación del calor, que se llama difusión anisotrópica. Con un coeficiente de difusión espacialmente constante, esto es equivalente a la ecuación de calor o al filtrado gaussiano lineal, pero con un coeficiente de difusión diseñado para detectar bordes, el ruido se puede eliminar sin desenfocar los bordes de la imagen.
Medios no locales
Otro enfoque para eliminar el ruido se basa en un promedio no local de todos los píxeles de una imagen. En particular, la cantidad de ponderación de un píxel se basa en el grado de similitud entre un pequeño parche centrado en ese píxel y el pequeño parche centrado en el píxel al que se le está eliminando el ruido.
Did you mean:Non Linear filters
Un filtro mediano es un ejemplo de filtro no lineal y, si se diseña correctamente, es muy bueno para preservar los detalles de la imagen. Para ejecutar un filtro de mediana:
- considerar cada pixel en la imagen
- ordenar los píxeles vecinos en orden basado en sus intensidades
- reemplazar el valor original del píxel con el valor medio de la lista
Un filtro de mediana es un filtro de selección de rango (RS), un miembro particularmente severo de la familia de filtros de selección de rango condicionado (RCRS); A veces se prefiere un miembro mucho más suave de esa familia, por ejemplo uno que selecciona el valor vecino más cercano cuando el valor de un píxel es externo en su vecindad y, en caso contrario, lo deja sin cambios, especialmente en aplicaciones fotográficas.
Los filtros de mediana y otros filtros RCRS son buenos para eliminar el ruido de sal y pimienta de una imagen y también causan relativamente poca borrosidad en los bordes y, por lo tanto, se usan a menudo en aplicaciones de visión por computadora.
Transformación wavelet
El objetivo principal de un algoritmo de eliminación de ruido de imagen es lograr tanto la reducción de ruido como la preservación de características utilizando los bancos de filtros wavelet. En este contexto, los métodos basados en wavelets son de particular interés. En el dominio wavelet, el ruido se distribuye uniformemente a lo largo de los coeficientes, mientras que la mayor parte de la información de la imagen se concentra en unos pocos grandes. Por lo tanto, los primeros métodos de eliminación de ruido basados en wavelets se basaron en la umbralización de coeficientes de subbandas detalladas. Sin embargo, la mayoría de los métodos de umbralización de wavelets tienen el inconveniente de que el umbral elegido puede no coincidir con la distribución específica de los componentes de señal y ruido en diferentes escalas y orientaciones.
Para abordar estas desventajas, se han desarrollado estimadores no lineales basados en la teoría bayesiana. En el marco bayesiano, se ha reconocido que un algoritmo de eliminación de ruido exitoso puede lograr tanto la reducción del ruido como la preservación de las características si emplea una descripción estadística precisa de los componentes de la señal y el ruido.
Métodos estadísticos
También existen métodos estadísticos para eliminar el ruido de las imágenes, aunque se utilizan con poca frecuencia porque son exigentes desde el punto de vista computacional. Para el ruido gaussiano, se pueden modelar los píxeles en una imagen en escala de grises como con distribución normal automática, donde el valor de escala de grises verdadero de cada píxel se distribuye normalmente con una media igual al valor promedio en escala de grises de su vecino. píxeles y una variación determinada.
Vamos δ δ i{displaystyle delta _{i} denota los píxeles adyacentes a i{displaystyle i}Pixel. Luego la distribución condicional de la intensidad de la escala gris (en una [0,1]{displaystyle [0,1]} escala) i{displaystyle i}El nodo es:
P()x()i)=cSilenciox()j)О О j▪ ▪ δ δ i)∝ ∝ e− − β β 2λ λ .. j▪ ▪ δ δ i()c− − x()j))2{displaystyle mathbb {P} (x(i)=c sometidax(j)forall jin delta i)propto e^{-{frac {beta }{2lambda }sum _{jin delta i}(c-x(j)^{2}}
para un parámetro elegido β β ≥ ≥ 0{displaystyle beta geq 0} y diferencia λ λ {displaystyle lambda }. Un método de denoización que utiliza el modelo auto-normal utiliza los datos de imagen como un anterior Bayesian y la densidad auto-normal como función de probabilidad, con la distribución posterior resultante que ofrece un medio o modo como imagen denoizada.
Algoritmos de coincidencia de bloques
Se puede aplicar un algoritmo de coincidencia de bloques para agrupar fragmentos de imágenes similares en macrobloques superpuestos de tamaño idéntico; luego, las pilas de macrobloques similares se filtran juntas en el dominio de transformación y cada fragmento de imagen finalmente se restaura a su ubicación original utilizando un promedio ponderado. de los píxeles superpuestos.
Campo aleatorio
Los campos de contracción son una técnica de aprendizaje automático basada en campos aleatorios que ofrece un rendimiento comparable al de la coincidencia de bloques y el filtrado 3D, pero requiere una sobrecarga computacional mucho menor (de modo que podría realizarse directamente dentro de sistemas integrados).
Aprendizaje profundo
Se han propuesto varios enfoques de aprendizaje profundo para resolver tareas de reducción de ruido y restauración de imágenes. Deep Image Prior es una de esas técnicas que utiliza una red neuronal convolucional y se distingue porque no requiere datos de entrenamiento previo.
Software
La mayoría de los programas de edición de imágenes y fotografías de uso general tendrán una o más funciones de reducción de ruido (mediana, desenfoque, eliminación de manchas, etc.).
Contenido relacionado
Matra Alicia
Conector APC-7
EBurro2000
