Desenfoque gaussiano

En el procesamiento de imágenes, un Difusivo gais (también conocido como Flujo Gausiano) es el resultado de difuminar una imagen por una función Gaussiana (nombrada después de matemático y científico Carl Friedrich Gauss).
Es un efecto ampliamente utilizado en el software de gráficos, normalmente para reducir el ruido de la imagen y los detalles. El efecto visual de esta técnica de desenfoque es un desenfoque suave que se asemeja al de ver la imagen a través de una pantalla translúcida, claramente diferente del efecto bokeh producido por una lente desenfocada o la sombra de un objeto bajo iluminación habitual.
El suavizado gaussiano también se utiliza como etapa de preprocesamiento en algoritmos de visión por computadora para mejorar las estructuras de imágenes en diferentes escalas; consulte la representación del espacio a escala y la implementación del espacio a escala.
Matemáticas
Matemáticamente, aplicar un desenfoque gaussiano a una imagen es lo mismo que convolucionar la imagen con una función gaussiana. Esto también se conoce como transformada de Weierstrass bidimensional. Por el contrario, la convolución mediante un círculo (es decir, un desenfoque de cuadro circular) reproduciría con mayor precisión el efecto bokeh.
Dado que la transformada de Fourier de una gaussiana es otra gaussiana, aplicar un desenfoque gaussiano tiene el efecto de reducir los componentes de alta frecuencia de la imagen; un desenfoque gaussiano es, por tanto, un filtro de paso bajo.

El desenfoque gaussiano es un tipo de filtro de desenfoque de imagen que utiliza una función gaussiana (que también expresa la distribución normal en estadísticas) para calcular la transformación que se aplicará a cada píxel de la imagen. La fórmula de una función gaussiana en una dimensión es
En dos dimensiones, es el producto de dos funciones Gaussianas, una en cada dimensión:
Los valores de esta distribución se utilizan para construir una matriz de convolución que se aplica a la imagen original. Este proceso de convolución se ilustra visualmente en la figura de la derecha. El nuevo valor de cada píxel se establece en un promedio ponderado de la vecindad de ese píxel. El valor del píxel original recibe el mayor peso (tiene el valor gaussiano más alto) y los píxeles vecinos reciben pesos más pequeños a medida que aumenta su distancia al píxel original. Esto da como resultado un desenfoque que conserva los límites y los bordes mejor que otros filtros de desenfoque más uniformes; ver también implementación de espacio a escala.
En teoría, la función gaisiana en cada punto de la imagen no será cero, lo que significa que toda la imagen necesitaría ser incluida en los cálculos para cada pixel. En la práctica, cuando se computa una aproximación discreta de la función gaissa, píxeles a una distancia de más de 3σ tener una influencia lo suficientemente pequeña para ser considerado efectivamente cero. Así, las contribuciones de píxeles fuera de ese rango pueden ser ignoradas. Típicamente, un programa de procesamiento de imágenes sólo necesita calcular una matriz con dimensiones ⌈ ⌈ 6σ σ ⌉ ⌉ {displaystyle lceil 6sigma rceil } × ⌈ ⌈ 6σ σ ⌉ ⌉ {displaystyle lceil 6sigma rceil } (donde) ⌈ ⌈ ⋅ ⋅ ⌉ ⌉ {displaystyle lceil cdot rceil } es la función de techo) para asegurar un resultado suficientemente cercano a la obtenida por toda la distribución gaisiana.
Además de ser circularmente simétrico, el difuminado gaisiano se puede aplicar a una imagen bidimensional como dos cálculos independientes de una dimensión, y por lo tanto se denomina un filtro separable. Es decir, el efecto de aplicar la matriz bidimensional también se puede lograr mediante la aplicación de una serie de matrices gaisianas monodimensionales en la dirección horizontal, repitiendo el proceso en la dirección vertical. En términos computacionales, esta es una propiedad útil, ya que el cálculo se puede realizar en O()wkernelwimagenhimagen)+O()hkernelwimagenhimagen){displaystyle Oleft(w_{text{kernel}w_{text{image}h_{text{image}}right)+Oleft(h_{text{kernel}w_{text{image}h_{text{image}h_{text{image}}}right)}}} tiempo (donde h es altura y w es ancho; ver la notación grande O), en lugar de O()wkernelhkernelwimagenhimagen){displaystyle Oleft(w_{text{kernel}h_{text{kernel}w_{text{image}h_{text{image}right)} para un núcleo no estable.
Aplicando difuminados gaussianos sucesivos a una imagen tiene el mismo efecto que aplicar un solo difuminado gaussiano más grande, cuyo radio es la raíz cuadrada de la suma de los cuadrados de los radios borrosos que se aplicaron realmente. Por ejemplo, la aplicación de difuminados gausianos sucesivos con radios de 6 y 8 da los mismos resultados que la aplicación de un solo difuminado gaisiano del radio 10, ya que 62+82=10{fnK}}=10}. Debido a esta relación, el tiempo de procesamiento no se puede salvar simulando un borrón gaisiano con difunciones sucesivas y más pequeñas, el tiempo requerido será al menos tan grande como la realización del único difunción grande.

El desenfoque gaussiano se utiliza habitualmente para reducir el tamaño de una imagen. Al reducir la resolución de una imagen, es común aplicar un filtro de paso bajo a la imagen antes de volver a muestrearla. Esto es para garantizar que no aparezca información falsa de alta frecuencia en la imagen reducida (aliasing). Los desenfoques gaussianos tienen buenas propiedades, como no tener bordes nítidos y, por lo tanto, no introducen zumbidos en la imagen filtrada.
Filtro de paso bajo
El desenfoque gaussiano es un filtro de paso bajo que atenúa las señales de alta frecuencia.
Su diagrama de Bode de amplitud (la escala logarítmica en el dominio de la frecuencia) es una parábola.
Reducción de varianza
¿Cuánto hace un filtro Gaussiano con desviación estándar σ σ f{displaystyle sigma _{f} lisa la imagen? En otras palabras, ¿cuánto reduce la desviación estándar de los valores de píxel en la imagen? Asumir los valores de píxel grayscale tienen una desviación estándar σ σ X{displaystyle sigma _{X}, después de aplicar el filtro la desviación estándar reducida σ σ r{displaystyle sigma _{r} puede ser aproximado como
Muestra de matriz gaussiana
Esta matriz de muestra se produce mediante el muestreo del núcleo filtrante Gaussiano (con σ = 0.84089642) en los puntos intermedios de cada pixel y luego la normalización. El elemento central (a [0, 0]) tiene el valor más grande, disminuyendo simétricamente a medida que aumenta la distancia del centro. Puesto que el origen del núcleo filtrante está en el centro, la matriz comienza en G()− − R,− − R){textstyle G(-R,-R)} y termina en G()R,R){textstyle G(R,R)} donde R iguala el radio del núcleo.
El elemento 0.22508352 (el central) es 1177 veces mayor que 0.00019117 que está justo fuera de 3σ.
Implementación
Un efecto de desenfoque gaussiano normalmente se genera al convolucionar una imagen con un núcleo FIR de valores gaussianos.
En la práctica, es mejor aprovechar la propiedad separable del desenfoque gaussiano dividiendo el proceso en dos pasadas. En la primera pasada, se utiliza un núcleo unidimensional para desenfocar la imagen sólo en la dirección horizontal o vertical. En la segunda pasada, se utiliza el mismo núcleo unidimensional para desenfocar en la dirección restante. El efecto resultante es el mismo que el de convolucionar con un núcleo bidimensional en una sola pasada, pero requiere menos cálculos.
La discretización normalmente se logra muestreando el núcleo del filtro gaussiano en puntos discretos, normalmente en posiciones correspondientes a los puntos medios de cada píxel. Esto reduce el costo computacional pero, para núcleos de filtro muy pequeños, el muestreo puntual de la función gaussiana con muy pocas muestras genera un gran error. En estos casos, la precisión se mantiene (con un ligero costo computacional) mediante la integración de la función gaussiana sobre el área de cada píxel.
Al convertir los valores continuos de Gauss en valores discretos necesarios para un núcleo, la suma de los valores será diferente de 1. Esto provocará un oscurecimiento o brillo de la imagen. Para remediar esto, los valores se pueden normalizar dividiendo cada término del núcleo por la suma de todos los términos del núcleo.
Un enfoque mucho mejor y teóricamente más fundamentado es realizar el suavizado con el análogo discreto del núcleo gaussiano, que posee propiedades similares en un dominio discreto a las que hace que el núcleo gaussiano continuo sea especial en un dominio continuo, por ejemplo , el núcleo correspondiente a la solución de una ecuación de difusión que describe un proceso de suavizado espacial, que obedece a una propiedad de semigrupo sobre las sumas de la varianza del núcleo, o que describe el efecto del movimiento browniano sobre un dominio espacial, y con la suma de sus los valores son exactamente iguales a 1. Para obtener una descripción más detallada sobre el análogo discreto del núcleo gaussiano, consulte el artículo sobre implementación de espacio de escala y.
La eficiencia de FIR se descompone para sigmas altos. Existen alternativas al filtro FIR. Estos incluyen los muy rápidos desenfoques de cuadros múltiples, el rápido y preciso detector de bordes IIR Deriche, un "desenfoque de pila" basado en el desenfoque del cuadro, y más.
Suavizado temporal causal-tiempo
Para procesar señales temporales o vídeos pregrabados, el núcleo gaussiano también se puede utilizar para suavizar el dominio temporal, ya que los datos están pregrabados y disponibles en todas las direcciones. Sin embargo, al procesar señales temporales o vídeo en situaciones de tiempo real, el núcleo gaussiano no se puede utilizar para el suavizado temporal, ya que accedería a datos del futuro que obviamente no pueden estar disponibles. Para el suavizado temporal en situaciones de tiempo real, se puede utilizar en su lugar el núcleo temporal denominado núcleo de límite causal de tiempo, que posee propiedades similares en una situación causal de tiempo (no creación de nuevas estructuras hacia una escala creciente y covarianza de escala temporal ) ya que el núcleo gaussiano obedece en el caso no causal. El núcleo de límite causal de tiempo corresponde a una convolución con un número infinito de núcleos exponenciales truncados acoplados en cascada, con constantes de tiempo específicamente elegidas. Para datos discretos, este núcleo a menudo puede aproximarse numéricamente mediante un pequeño conjunto de filtros recursivos de primer orden acoplados en cascada; consulte para obtener más detalles.
Usos comunes

Detección de bordes
El suavizado gaussiano se utiliza comúnmente con la detección de bordes. La mayoría de los algoritmos de detección de bordes son sensibles al ruido; El filtro laplaciano 2-D, construido a partir de una discretización del operador de Laplace, es muy sensible a entornos ruidosos.
El uso de un filtro de Desenfoque Gaussiano antes de la detección de bordes tiene como objetivo reducir el nivel de ruido en la imagen, lo que mejora el resultado del siguiente algoritmo de detección de bordes. Este enfoque se conoce comúnmente como filtrado Laplaciano de Gauss o LoG.
Fotografía
Las cámaras digitales de gama baja, incluidas muchas cámaras de teléfonos móviles, suelen utilizar el desenfoque gaussiano para ocultar el ruido de la imagen causado por sensibilidades de luz ISO más altas.
El desenfoque gaussiano se aplica automáticamente como parte del posprocesamiento de la imagen por parte del software de la cámara, lo que provoca una pérdida irreversible de detalles.
Notas y referencias
- ^ Shapiro, L. G. ' Stockman, G. C: "Computer Vision", página 137, 150. Prentice Hall, 2001
- ^ Mark S. Nixon y Alberto S. Aguado. Extracción de imágenes y procesamiento de imágenes. Academic Press, 2008, pág. 88.
- ^ a b R.A. Haddad y A.N. Akansu, "A Class of Fast Gaussian Binomial Filters for Speech and Image Processing", IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 39, pp 723-727, marzo 1991.
- ^ Erik Reinhard. Imágenes de alta gama dinámica: Adquisición, visualización y iluminación basada en imágenes. Morgan Kaufmann, 2006, págs. 233 a 234.
- ^ a b Lindeberg, T. "Escale-space for discrete signals", PAMI(12), No. 3, marzo 1990, pp. 234-254.
- ^ Getreuer, Pascal (17 diciembre 2013). "ASurvey of Gaussian Convolution Algorithms". Procesamiento de imagen en línea. 3: 286-310. doi:10.5201/ipol.2013.87. (código doc)
- ^ a b Lindeberg, T. (23 de enero de 2023). "Un tiempo-causal y recursivo escala-covariante representación escala-espacio de señales temporales y tiempo pasado". Cibernética biológica. 117 (1–2): 21–59. doi:10.1007/s00422-022-00953-6. PMC 10160219. PMID 36689001.
- ^ Fisher, Perkins, Walker " Wolfart (2003). Filtros espaciales - Laplaciano de Gaussian. Retrieved 2010-09-13.
{{cite web}}
: CS1 maint: múltiples nombres: lista de autores (link) - ^ Ritter, Frank (24 de octubre de 2013). "Smartphone-Kameras: Warum gute Fotos zu schießen nicht mehr ausreicht [Kommentar]". GIGA (en alemán). GIGA Television. Retrieved 20 de septiembre 2020.
Bei Fotos, muere en der Nacht entstanden sind, dominiert Pixelmatsch.
Contenido relacionado
Historia de la cámara
Tubo de vacío
Señales de humo