Escala de grises

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Imagen donde la intensidad de cada pixel se muestra sólo valores acromáticos de negro, gris y blanco

En fotografía digital, imágenes generadas por computadora y colorimetría, una imagen en escala de grises es aquella en la que el valor de cada píxel es una muestra única que representa solo una cantidad de luz; es decir, sólo lleva información de intensidad. Las imágenes en escala de grises, una especie de monocromo en blanco y negro o gris, se componen exclusivamente de tonos de gris. El contraste varía desde el negro con la intensidad más débil hasta el blanco con la intensidad más fuerte.

Las imágenes en escala de grises se diferencian de las imágenes bitonales en blanco y negro de un bit, que, en el contexto de las imágenes por ordenador, son imágenes con sólo dos colores: blanco y negro (también llamadas binivel). o imágenes binarias). Las imágenes en escala de grises tienen muchos tonos de gris intermedios.

Las imágenes en escala de grises pueden ser el resultado de medir la intensidad de la luz en cada píxel de acuerdo con una combinación ponderada particular de frecuencias (o longitudes de onda) y, en tales casos, son monocromáticas propiamente dichas cuando solo se utiliza una única frecuencia (en la práctica, una estrecha). banda de frecuencias). En principio, las frecuencias pueden ser de cualquier parte del espectro electromagnético (por ejemplo, infrarrojos, luz visible, ultravioleta, etc.).

Una imagen colorimétrica (o más específicamente fotométrica) en escala de grises es una imagen que tiene un espacio de color en escala de grises definido, que asigna los valores de muestra numéricos almacenados al canal acromático de un espacio de color estándar, que a su vez se basa en las propiedades medidas de la visión humana.

Si la imagen en color original no tiene un espacio de color definido, o si la imagen en escala de grises no tiene la misma intensidad acromática percibida por el ser humano que la imagen en color, entonces no existe una asignación única de dicha imagen en color a una imagen en escala de grises..

Representaciones numéricas

Una imagen a escala de grises

La intensidad de un píxel se expresa dentro de un rango determinado entre un mínimo y un máximo, ambos inclusive. Este rango se representa de forma abstracta como un rango de 0 (o 0%) (ausencia total, negro) y 1 (o 100%) (presencia total, blanco), con cualquier valor fraccionario intermedio. Esta notación se utiliza en artículos académicos, pero no define lo que es "negro". o "blanco" es en términos de colorimetría. A veces, la escala se invierte, como en la impresión, donde la intensidad numérica indica cuánta tinta se emplea en los medios tonos, siendo el 0% el papel blanco (sin tinta) y el 100% un negro sólido (tinta completa).

En informática, aunque la escala de grises se puede calcular mediante números racionales, los píxeles de la imagen generalmente se cuantifican para almacenarlos como enteros sin signo, para reducir el almacenamiento y el cálculo necesarios. Algunos de los primeros monitores en escala de grises sólo podían mostrar hasta dieciséis tonos diferentes, que se almacenarían en forma binaria utilizando 4 bits. Pero hoy en día, las imágenes en escala de grises destinadas a la visualización se almacenan comúnmente con 8 bits por píxel muestreado. Esta profundidad de píxel permite registrar 256 intensidades diferentes (es decir, tonos de gris) y también simplifica el cálculo, ya que se puede acceder a cada muestra de píxel individualmente como un byte completo. Sin embargo, si estas intensidades estuvieran espaciadas igualmente en proporción a la cantidad de luz física que representan en ese píxel (llamado codificación lineal o escala), las diferencias entre tonos oscuros adyacentes podrían ser bastante notables como artefactos de bandas, mientras que muchos de los tonos más claros sería un "desperdiciado" codificando una gran cantidad de incrementos perceptivamente indistinguibles. Por lo tanto, las sombras generalmente se distribuyen uniformemente en una escala no lineal comprimida gamma, que se aproxima mejor a los incrementos perceptivos uniformes para las sombras oscuras y claras, lo que generalmente hace que estos 256 tonos sean suficientes para evitar incrementos notables.

Los usos técnicos (por ejemplo, en aplicaciones de imágenes médicas o sensores remotos) a menudo requieren más niveles para aprovechar al máximo la precisión del sensor (normalmente 10 o 12 bits por muestra) y reducir los errores de redondeo en los cálculos. Dieciséis bits por muestra (65.536 niveles) suele ser una opción conveniente para tales usos, ya que las computadoras administran palabras de 16 bits de manera eficiente. Los formatos de archivos de imagen TIFF y PNG (entre otros) admiten de forma nativa la escala de grises de 16 bits, aunque los navegadores y muchos programas de imágenes tienden a ignorar los 8 bits de orden bajo de cada píxel. Internamente, para el cálculo y el almacenamiento de trabajo, el software de procesamiento de imágenes suele utilizar números enteros o de punto flotante de 16 o 32 bits.

Convertir color a escala de grises

La conversión de una imagen en color arbitraria a escala de grises no es única en general; La diferente ponderación de los canales de color representa efectivamente el efecto de filmar películas en blanco y negro con filtros fotográficos de diferentes colores en las cámaras.

Conversión colorimétrica (preservación de la luminancia perceptual) a escala de grises

Una estrategia común es utilizar los principios de la fotometría o, más ampliamente, la colorimetría para calcular los valores de escala de grises (en el espacio de color de escala de grises de destino) para tener la misma luminancia (técnicamente luminancia relativa) que la imagen en color original (según a su espacio de color). Además de la misma luminancia (relativa), este método también garantiza que ambas imágenes tendrán la misma luminancia absoluta cuando se muestren, como puede medirse con instrumentos en sus unidades SI de candelas por metro cuadrado, en cualquier área determinada de la imagen. dados puntos blancos iguales. La luminancia en sí se define utilizando un modelo estándar de visión humana, por lo que preservar la luminancia en la imagen en escala de grises también preserva otras medidas de luminosidad perceptiva, como L* (como en el espacio de color CIE Lab de 1976) que está determinado por la luminancia lineal Y (como en el espacio de color CIE 1931 espacio de color XYZ) al que nos referiremos aquí como Ylineal para evitar cualquier ambigüedad.

Para convertir un color de un espacio de color basado en un modelo típico de color RGB (no lineal) de color gamma comprimido a una representación en escala gris de su luminancia, la función de compresión gamma debe ser eliminada primero a través de la expansión gamma (linearización) para transformar la imagen en un espacio de color RGB lineal, de modo que la suma ponderada apropiada se puede aplicar a los componentes de color lineal (Rlinear,Glinear,Blinear{displaystyle R_{mathrm {linear},G_{mathrm {linear},B_{mathrm {linear}) para calcular la luminancia lineal Ylineal, que puede entonces ser comprimida gamma de nuevo si el resultado de grayscale es también para ser codificado y almacenado en un típico colorespacio no lineal.

Para el espacio de color sRGB común, la expansión gamma se define como

Clinear={}Csrgb12.92,siCsrgb≤ ≤ 0,04045()Csrgb+0,0551.055)2.4,de otra manera{displaystyle C_{mathrm {linear} {begin{cases}{frac {C_{mathrm { srgb}}{12.92}}} {text{if} #C_{mathrm {srgb}leq 0.04045\left({frac {C_{mathrm {srgb} }+0.055}right)^{2.4}, {text{otherwise}}end{cases}}}}}}}}}

donde Csrgb representa cualquiera de los tres primarios sRGB con compresión gamma (Rsrgb, Gsrgb y Bsrgb, cada uno en el rango [0,1]) y Clineal es el valor de intensidad lineal correspondiente (Rlineal, Glineal y Blineal, también en el rango [0,1]). Luego, la luminancia lineal se calcula como una suma ponderada de los tres valores de intensidad lineal. El espacio de color sRGB se define en términos de la luminancia lineal CIE 1931 Ylineal, que viene dada por

Ylinear=0.2126Rlinear+0,75152Glinear+0,0722Blinear.{displaystyle Y_{mathrm {linear} }=0.2126R_{mathrm {linear}+0.7152G_{mathrm {linear}+0.0722B_{mathrm {linear} }

Estos tres coeficientes particulares representan la percepción de intensidad (luminancia) de los humanos tricromáticos típicos a la luz de los colores primarios aditivos Rec. 709 precisos (cromaticidades) que se utilizan en la definición de sRGB. La visión humana es más sensible al verde, por lo que tiene el mayor valor de coeficiente (0.7152), y menos sensible al azul, por lo que este tiene el coeficiente más pequeño (0.0722). Para codificar la intensidad de grayscale en la RGB lineal, cada uno de los tres componentes de color se puede configurar para igualar la luminancia lineal calculada Ylinear{displaystyle Y... (replazo Rlinear,Glinear,Blinear{displaystyle R_{mathrm {linear},G_{mathrm {linear},B_{mathrm {linear} por los valores Ylinear,Ylinear,Ylinear{displaystyle Y... para conseguir este grayscale lineal), que entonces normalmente necesita ser gamma comprimido para volver a una representación convencional no lineal. Para el SRGB, cada una de sus tres primarias se establece entonces al mismo gamma-comprimido Ysrgb dado por el inverso de la expansión gamma arriba como

Ysrgb={}12.92Ylinear,siYlinear≤ ≤ 0,00313081.055Ylinear1/2.4− − 0,055,de otra manera{displaystyle Y_{mathrm {srgb}={begin{cases}12.92 Y_{mathrm {linear} }, {text{if }Y_{mathrm {linear}leq 0.0031308\1.055 Y_{mathrm {linear} } {1/2.4}-0.055, âtext{otherwise}end{cases}}

Debido a que los tres componentes sRGB son iguales, lo que indica que en realidad es una imagen gris (no color), solo es necesario almacenar estos valores una vez, y a esto lo llamamos imagen en escala de grises resultante. Así es como normalmente se almacenará en formatos de imagen compatibles con sRGB que admitan una representación en escala de grises de un solo canal, como JPEG o PNG. Los navegadores web y otros programas que reconocen imágenes sRGB deberían producir la misma representación para una imagen en escala de grises que para una imagen de "color" Imagen sRGB que tiene los mismos valores en los tres canales de color.

Codificación Luma en sistemas de vídeo

Para imágenes en espacios de color como Y'UV y sus parientes, que se utilizan en sistemas de vídeo y televisión en color estándar como PAL, SECAM y NTSC, un componente de luma no lineal (Y) se calcula directamente a partir de intensidades primarias comprimidas gamma como una ponderación suma, que, aunque no es una representación perfecta de la luminancia colorimétrica, se puede calcular más rápidamente sin la expansión y compresión gamma utilizadas en los cálculos fotométricos/colorimétricos. En los modelos Y'UV y Y'IQ utilizados por PAL y NTSC, el luma rec601 (Y) el componente se calcula como

Y.=0.299R.+0,5987G.+0.114B.{displaystyle Y'=0.299R'+0.587G'+0.114B'}
Y.=0.2126R.+0,75152G.+0,0722B..{displaystyle Y'=0.2126R'+0.7152G'+0.0722B'}
Y.=0,2627R.+0,6780G.+0,0593B..{displaystyle Y'=0.2627R'+0.6780G'+0.0593B'}

Normalmente, estos espacios de color se transforman nuevamente a colores R'G'B' no lineales. antes de renderizar para su visualización. En la medida en que quede suficiente precisión, se podrán representar con precisión.

Pero si el componente luma Y' en cambio, se utiliza directamente como una representación en escala de grises de la imagen en color, la luminancia no se conserva: dos colores pueden tener la misma luma Y pero diferente luminancia lineal CIE Y (y por lo tanto diferente no lineal Ysrgb como se define anteriormente) y, por lo tanto, parece más oscuro o más claro para un humano típico que el color original. De manera similar, dos colores que tienen la misma luminancia Y (y por lo tanto el mismo Ysrgb) en general tendrá una luma diferente según cualquiera de los Y definiciones de luma anteriores.

Escala de grises como canales únicos de imágenes en color multicanal

Las imágenes en color a menudo se crean a partir de varios canales de color apilados, cada uno de los cuales representa niveles de valor del canal determinado. Por ejemplo, las imágenes RGB se componen de tres canales independientes para componentes de colores primarios rojo, verde y azul; Las imágenes CMYK tienen cuatro canales para planchas de tinta cian, magenta, amarilla y negra, etc.

A continuación se muestra un ejemplo de división de canales de color de una imagen en color RGB completa. La columna de la izquierda muestra los canales de color aislados en colores naturales, mientras que a la derecha están sus equivalencias en escala de grises:

Composición de RGB de tres imágenes en escala gris

También es posible lo contrario: crear una imagen a todo color a partir de sus canales de escala de grises separados. Al alterar los canales, utilizar compensaciones, rotar y otras manipulaciones, se pueden lograr efectos artísticos en lugar de reproducir con precisión la imagen original.

Contenido relacionado

Tarjeta perforada

Una tarjeta perforada es un trozo de papel rígido que contiene datos digitales representados por la presencia o ausencia de agujeros en posiciones...

CPython

CPython es la implementación de referencia del lenguaje de programación Python. Escrito en C y Python, CPython es la implementación predeterminada y más...

Arquitectura Harvard

La Arquitectura Harvard es un modelo de arquitectura informática que separa físicamente la memoria de código de programa de la memoria de almacenamiento de...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save