Artefacto de compresión
Un artefacto de compresión (o artefacto) es una distorsión notable de los medios (incluidas imágenes, audio y video) causada por la aplicación de compresión con pérdida. La compresión de datos con pérdida implica descartar algunos de los datos de los medios para que se vuelvan lo suficientemente pequeños como para almacenarlos en el espacio de disco deseado o transmitirlos (transmitir) dentro del ancho de banda disponible (conocido como velocidad de datos). o tasa de bits). Si el compresor no puede almacenar suficientes datos en la versión comprimida, el resultado es una pérdida de calidad o la introducción de artefactos. El algoritmo de compresión puede no ser lo suficientemente inteligente para discriminar entre distorsiones de poca importancia subjetiva y aquellas objetables para el usuario.
Los artefactos de compresión digital más comunes son los bloques DCT, causados por el algoritmo de compresión de transformada discreta de coseno (DCT) que se usa en muchos estándares de medios digitales, como los formatos de archivo de video JPEG, MP3 y MPEG. Estos artefactos de compresión aparecen cuando se aplica una compresión intensa y ocurren a menudo en medios digitales comunes, como DVD, formatos de archivo de computadora comunes como archivos JPEG, MP3 y MPEG, y algunas alternativas al disco compacto, como los de Sony. Formato minidisco. Los medios sin comprimir (como discos láser, CD de audio y archivos WAV) o los medios comprimidos sin pérdidas (como FLAC o PNG) no sufren artefactos de compresión.
La minimización de los artefactos perceptibles es un objetivo clave en la implementación de un algoritmo de compresión con pérdida. Sin embargo, los artefactos se producen ocasionalmente intencionadamente con fines artísticos, un estilo conocido como glitch art o datamoshing.
Técnicamente hablando, un artefacto de compresión es una clase particular de error de datos que suele ser consecuencia de la cuantificación en la compresión de datos con pérdida. Cuando se utiliza la codificación de transformación, normalmente asume la forma de una de las funciones básicas del espacio de transformación del codificador.
Imágenes
Al realizar la codificación de transformada de coseno discreta (DCT) basada en bloques para la cuantificación, como en las imágenes comprimidas con JPEG, pueden aparecer varios tipos de artefactos.
- Anillo
- Contorno
- Posterización
- Ruido de escalera (aliasing) a lo largo de bordes curvados
- Bloqueo en las regiones de "busy" (objetos de límites cortos, a veces llamados macroblocking, quilting o checkerboarding)
Otros algoritmos con pérdida, que utilizan la coincidencia de patrones para deduplicar símbolos similares, son propensos a introducir errores difíciles de detectar en el texto impreso. Por ejemplo, los números "6" y "8" puede ser reemplazado. Se ha observado que esto sucede con JBIG2 en ciertas máquinas fotocopiadoras.
Artefactos de límite de bloque
A tasas de bits bajas, cualquier esquema de codificación basado en bloques con pérdida introduce artefactos visibles en bloques de píxeles y en los límites de bloque. Estos límites pueden transformar los límites de los bloques, los límites de los bloques de predicción o ambos, y pueden coincidir con los límites de los macrobloques. El término macrobloqueo se usa comúnmente independientemente de la causa del artefacto. Otros nombres incluyen embaldosado, mosaico, pixelado, acolchado y damero.
Los artefactos de bloque son el resultado del principio mismo de la codificación de transformación de bloque. La transformada (por ejemplo, la transformada de coseno discreta) se aplica a un bloque de píxeles y, para lograr una compresión con pérdidas, se cuantifican los coeficientes de transformada de cada bloque. Cuanto más baja es la tasa de bits, más toscamente se representan los coeficientes y más coeficientes se cuantifican a cero. Estadísticamente, las imágenes tienen más contenido de baja frecuencia que de alta frecuencia, por lo que es el contenido de baja frecuencia que permanece después de la cuantificación, lo que da como resultado bloques borrosos de baja resolución. En el caso más extremo, solo se retiene el coeficiente DC, es decir, el coeficiente que representa el color promedio de un bloque, y el bloque transformado es solo de un solo color después de la reconstrucción.
Debido a que este proceso de cuantificación se aplica individualmente en cada bloque, los bloques vecinos cuantifican los coeficientes de manera diferente. Esto conduce a discontinuidades en los límites de los bloques. Estos son más visibles en áreas planas, donde hay pocos detalles para enmascarar el efecto.
Reducción de artefactos de imagen
Se han propuesto varios enfoques para reducir los efectos de compresión de imágenes, pero para utilizar técnicas estandarizadas de compresión/descompresión y conservar los beneficios de la compresión (por ejemplo, menores costos de transmisión y almacenamiento), muchos de estos métodos se enfocan en "post -procesamiento"—es decir, procesamiento de imágenes cuando se reciben o visualizan. No se ha demostrado que ninguna técnica de posprocesamiento mejore la calidad de la imagen en todos los casos; en consecuencia, ninguno ha obtenido una aceptación generalizada, aunque algunos se han implementado y están en uso en sistemas propietarios. Muchos programas de edición de fotos, por ejemplo, tienen incorporados algoritmos patentados de reducción de artefactos JPEG. Los equipos de consumo suelen denominar a este posprocesamiento "reducción de ruido MPEG".
El artefacto de límite en JPEG se puede convertir en "granos" no muy diferente a los de las películas fotográficas ISO altas. En lugar de simplemente multiplicar los coeficientes cuantificados con el paso de cuantificación Q perteneciente a la frecuencia 2D, el ruido inteligente en forma de una señal aleatoria número en el intervalo [-Q/2; Q/2] se puede agregar al coeficiente descuantificado. Este método se puede agregar como una parte integral de los descompresores JPEG que trabajan en billones de imágenes JPEG existentes y futuras. Como tal, no es un "post-procesamiento" técnica.
El problema de los timbres se puede reducir en el momento de la codificación sobrepasando los valores de DCT y eliminando los timbres.
Por lo general, la posterización solo ocurre con baja calidad, cuando se da muy poca importancia a los valores de DC. Ajustar la tabla de cuantización ayuda.
Vídeo
Cuando se utiliza la predicción de movimiento, como en MPEG-1, MPEG-2 o MPEG-4, los artefactos de compresión tienden a permanecer en varias generaciones de fotogramas descomprimidos y se mueven con el flujo óptico de la imagen, lo que genera un efecto peculiar., a medio camino entre un efecto de pintura y "grime" que se mueve con los objetos en la escena.
Los errores de datos en el flujo de bits comprimido, posiblemente debido a errores de transmisión, pueden generar errores similares a grandes errores de cuantización, o pueden interrumpir el análisis del flujo de datos por completo durante un breve período de tiempo, lo que lleva a una "interrupción -arriba" de la imagen Cuando se han producido errores graves en el flujo de bits, los decodificadores continúan aplicando actualizaciones a la imagen dañada durante un breve intervalo, creando una "imagen fantasma" efecto, hasta recibir el siguiente cuadro comprimido de forma independiente. En la codificación de imágenes MPEG, estos se conocen como "I-frames", con la 'I' representando "intra". Hasta que llegue el siguiente cuadro I, el decodificador puede realizar la ocultación de errores.
Artefactos de límite de bloque de compensación de movimiento
Las discontinuidades de límite de bloque pueden ocurrir en los bordes de los bloques de predicción de compensación de movimiento. En la compresión de vídeo con compensación de movimiento, la imagen actual se predice desplazando bloques (macrobloques, particiones o unidades de predicción) de píxeles de fotogramas previamente decodificados. Si dos bloques vecinos usan diferentes vectores de movimiento, habrá una discontinuidad en el borde entre los bloques.
Ruido de mosquitos
Los artefactos de compresión de video incluyen los resultados acumulativos de la compresión de las imágenes fijas que lo componen, por ejemplo, el timbre u otro movimiento en los bordes en imágenes fijas sucesivas aparecen en secuencia como un borrón brillante de puntos alrededor de los bordes, llamado ruido de mosquito, ya que se asemejan a mosquitos que pululan alrededor del objeto. El llamado "ruido de mosquito" es causado por el algoritmo de compresión de transformación de coseno discreto (DCT) basado en bloques que se usa en la mayoría de los estándares de codificación de video, como los formatos MPEG.
Reducción de artefactos de video
Los artefactos en los límites de los bloques se pueden reducir aplicando un filtro de desbloqueo. Al igual que en la codificación de imágenes fijas, es posible aplicar un filtro de desbloqueo a la salida del decodificador como procesamiento posterior.
En la codificación de video con predicción de movimiento con un bucle de predicción cerrado, el codificador usa la salida del decodificador como la referencia de predicción a partir de la cual se predicen los fotogramas futuros. Para ello, el codificador integra conceptualmente un decodificador. Si este "decodificador" realiza un desbloqueo, la imagen desbloqueada se utiliza luego como imagen de referencia para la compensación de movimiento, lo que mejora la eficiencia de codificación al evitar la propagación de artefactos de bloque a través de fotogramas. Esto se conoce como filtro de desbloqueo en bucle. Los estándares que especifican un filtro de desbloqueo en bucle incluyen VC-1, H.263 Anexo J, H.264/AVC y H.265/HEVC.
Sonido
La compresión de audio con pérdida suele funcionar con un modelo psicoacústico, un modelo de percepción auditiva humana. Los formatos de audio con pérdida suelen implicar el uso de una transformada en el dominio del tiempo/frecuencia, como una transformada de coseno discreta modificada. Con el modelo psicoacústico se explotan efectos de enmascaramiento como el enmascaramiento de frecuencia y el enmascaramiento temporal, de manera que no se graban sonidos que deberían ser imperceptibles. Por ejemplo, en general, los seres humanos son incapaces de percibir un tono bajo tocado simultáneamente con un tono similar pero más alto. Una técnica de compresión con pérdida podría identificar este tono bajo e intentar eliminarlo. Además, el ruido de cuantificación se puede "ocultar" donde estarían enmascarados por sonidos más prominentes. Con baja compresión, se usa un modelo psi conservador con tamaños de bloque pequeños.
Cuando el modelo psicoacústico no es preciso, cuando el tamaño del bloque de transformación está restringido o cuando se usa una compresión agresiva, esto puede generar artefactos de compresión. Los artefactos de compresión en el audio comprimido suelen aparecer como zumbidos, ecos previos, "artefactos de pajaritos", caídas, traqueteo, trinos, zumbidos metálicos, una sensación subacuática, silbidos o "granulosidad".
Un ejemplo de artefactos de compresión en el audio son los aplausos en un archivo de audio relativamente comprimido (por ejemplo, MP3 de 96 kbit/seg). En general, los tonos musicales tienen formas de onda repetitivas y variaciones de volumen más predecibles, mientras que los aplausos son esencialmente aleatorios, por lo que son difíciles de comprimir. Una pista de aplausos muy comprimida puede tener un "resonido metálico" y otros artefactos de compresión.
Uso artístico
Los artefactos de compresión pueden usarse intencionalmente como un estilo visual, a veces conocido como arte glitch. El arte glitch de Rosa Menkman hace uso de artefactos de compresión, particularmente los bloques de transformación de coseno discretos (bloques DCT) que se encuentran en la mayoría de los formatos de compresión de datos de medios digitales, como imágenes digitales JPEG y audio digital MP3. En imágenes fijas, un ejemplo es Jpegs del fotógrafo alemán Thomas Ruff, que utiliza artefactos JPEG intencionales como base del estilo de la imagen.
En el arte del video, una técnica utilizada es el datamoshing, donde dos videos se intercalan para que los cuadros intermedios se interpolen desde dos fuentes separadas. Otra técnica consiste simplemente en transcodificar de un formato de video con pérdida a otro, lo que aprovecha la diferencia en cómo los códecs de video separados procesan la información de movimiento y color. La técnica fue iniciada por los artistas Bertrand Planes en colaboración con Christian Jacquemin en 2006 con DivXPrime, Sven König, Takeshi Murata, Jacques Perconte y Paul B. Davis en colaboración con Paperrad, y más recientemente utilizada por David OReilly y en videos musicales para Chairlift y de Nabil Elderkin en la "Bienvenido a Heartbreak" vídeo musical de Kanye West.
También hay un género de memes de Internet en el que, a menudo, las imágenes sin sentido se comprimen mucho a propósito, a veces varias veces, para lograr un efecto cómico. Las imágenes creadas con esta técnica a menudo se denominan "fritas".
Contenido relacionado
Aceleración del cambio
Pagos móviles
Historia militar