Compresión con pérdida

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Baja compresión (alta calidad) JPEG

Alta compresión (bajo calidad) JPEG

En tecnología de la información, compresión con pérdida o compresión irreversible es la clase de métodos de compresión de datos que utiliza aproximaciones inexactas y descarte parcial de datos para representar el contenido. Estas técnicas se utilizan para reducir el tamaño de los datos para almacenar, manejar y transmitir contenido. Las diferentes versiones de la foto del gato en esta página muestran cómo los grados más altos de aproximación crean imágenes más toscas a medida que se eliminan más detalles. Esto se opone a la compresión de datos sin pérdidas (compresión de datos reversible) que no degrada los datos. La cantidad de reducción de datos posible usando compresión con pérdida es mucho mayor que usando técnicas sin pérdida.

La tecnología de compresión con pérdida bien diseñada a menudo reduce significativamente el tamaño de los archivos antes de que el usuario final note la degradación. Incluso cuando el usuario lo nota, puede ser deseable una mayor reducción de datos (por ejemplo, para la comunicación en tiempo real o para reducir los tiempos de transmisión o las necesidades de almacenamiento). El algoritmo de compresión con pérdida más utilizado es la transformada de coseno discreta (DCT), publicada por primera vez por Nasir Ahmed, T. Natarajan y K. R. Rao en 1974.

La compresión con pérdida se usa más comúnmente para comprimir datos multimedia (audio, video e imágenes), especialmente en aplicaciones como transmisión de medios y telefonía por Internet. Por el contrario, la compresión sin pérdida suele ser necesaria para archivos de texto y datos, como registros bancarios y artículos de texto. Puede ser ventajoso crear un archivo maestro sin pérdidas que luego se pueda usar para producir copias adicionales. Esto permite evitar basar nuevas copias comprimidas en un archivo fuente con pérdidas, lo que produciría artefactos adicionales y una mayor pérdida de información innecesaria.

Tipos

Es posible comprimir muchos tipos de datos digitales de manera que se reduzca el tamaño de un archivo de computadora necesario para almacenarlos, o el ancho de banda necesario para transmitirlos, sin pérdida de la información completa contenida en el archivo original. Una imagen, por ejemplo, se convierte en un archivo digital considerándola como una matriz de puntos y especificando el color y el brillo de cada punto. Si la imagen contiene un área del mismo color, se puede comprimir sin pérdida diciendo "200 puntos rojos" en lugar de "punto rojo, punto rojo,...(197 veces más)..., punto rojo."

Los datos originales contienen cierta cantidad de información y existe un límite inferior para el tamaño del archivo que puede contener toda la información. La teoría básica de la información dice que existe un límite absoluto para reducir el tamaño de estos datos. Cuando los datos se comprimen, su entropía aumenta y no puede aumentar indefinidamente. Por ejemplo, un archivo ZIP comprimido es más pequeño que su original, pero comprimir repetidamente el mismo archivo no reducirá el tamaño a nada. La mayoría de los algoritmos de compresión pueden reconocer cuándo una mayor compresión sería inútil y, de hecho, aumentaría el tamaño de los datos.

En muchos casos, los archivos o flujos de datos contienen más información de la necesaria. Por ejemplo, una imagen puede tener más detalles de los que el ojo puede distinguir cuando se reproduce en el tamaño más grande previsto; del mismo modo, un archivo de audio no necesita muchos detalles finos durante un pasaje muy alto. Desarrollar técnicas de compresión con pérdida lo más parecidas posible a la percepción humana es una tarea compleja. A veces, lo ideal es un archivo que proporcione exactamente la misma percepción que el original, eliminando la mayor cantidad posible de información digital; otras veces, la pérdida perceptible de calidad se considera una compensación válida.

Los términos "irreversible" y "reversible" se prefieren a los "con pérdida" y "sin pérdidas" respectivamente para algunas aplicaciones, como la compresión de imágenes médicas, para eludir las implicaciones negativas de la "pérdida". El tipo y la cantidad de pérdida pueden afectar la utilidad de las imágenes. Los artefactos o efectos indeseables de la compresión pueden ser claramente perceptibles y, sin embargo, el resultado sigue siendo útil para el propósito previsto. O las imágenes comprimidas con pérdida pueden ser 'visualmente sin pérdidas', o en el caso de imágenes médicas, se puede haber aplicado la denominada Compresión Irreversible Aceptable de Diagnóstico (DAIC).

Codificación de transformación

Algunas formas de compresión con pérdida se pueden considerar como una aplicación de codificación de transformación, que es un tipo de compresión de datos utilizada para imágenes digitales, señales de audio digital y video digital. La transformación se usa normalmente para habilitar una mejor cuantificación (más específica). El conocimiento de la aplicación se utiliza para elegir información para descartar, lo que reduce su ancho de banda. La información restante se puede comprimir a través de una variedad de métodos. Cuando se decodifica la salida, es posible que el resultado no sea idéntico a la entrada original, pero se espera que sea lo suficientemente similar para el propósito de la aplicación.

La forma más común de compresión con pérdida es un método de codificación de transformada, la transformada de coseno discreta (DCT), que fue publicada por primera vez por Nasir Ahmed, T. Natarajan y K. R. Rao en 1974. DCT es la forma de compresión con pérdida más utilizada compresión, para formatos populares de compresión de imágenes (como JPEG), estándares de codificación de video (como MPEG y H.264/AVC) y formatos de compresión de audio (como MP3 y AAC).

En el caso de los datos de audio, una forma popular de codificación de transformación es la codificación perceptiva, que transforma los datos sin procesar en un dominio que refleja con mayor precisión el contenido de la información. Por ejemplo, en lugar de expresar un archivo de sonido como los niveles de amplitud a lo largo del tiempo, uno puede expresarlo como el espectro de frecuencia a lo largo del tiempo, lo que corresponde con mayor precisión a la percepción humana del audio. Si bien la reducción de datos (compresión, ya sea con pérdida o sin pérdida) es un objetivo principal de la codificación de transformación, también permite otros objetivos: uno puede representar datos con mayor precisión para la cantidad de espacio original; por ejemplo, en principio, si uno comienza con un master analógico o digital de alta resolución, un archivo MP3 de un tamaño determinado debería proporcionar una mejor representación que un audio sin comprimir sin procesar en un archivo WAV o AIFF del mismo tamaño. Esto se debe a que el audio sin comprimir solo puede reducir el tamaño del archivo al reducir la velocidad de bits o la profundidad, mientras que comprimir el audio puede reducir el tamaño manteniendo la velocidad de bits y la profundidad. Esta compresión se convierte en una pérdida selectiva de los datos menos significativos, en lugar de perder datos en general. Además, una codificación de transformación puede proporcionar un mejor dominio para manipular o editar los datos; por ejemplo, la ecualización del audio se expresa de forma más natural en el dominio de la frecuencia (aumentar los graves, por ejemplo) en lugar del dominio del tiempo sin procesar.

Desde este punto de vista, la codificación perceptiva no se trata esencialmente de descartar datos, sino de una mejor representación de datos. Otro uso es para la compatibilidad con versiones anteriores y la degradación elegante: en la televisión en color, la codificación del color a través de un dominio de transformación de luminancia-crominancia (como YUV) significa que los conjuntos en blanco y negro muestran la luminancia, ignorando la información de color. Otro ejemplo es el submuestreo de croma: el uso de espacios de color como YIQ, que se usa en NTSC, permite reducir la resolución de los componentes de acuerdo con la percepción humana: los humanos tienen la resolución más alta para blanco y negro (luma), la resolución más baja. para colores de espectro medio como el amarillo y el verde, y el más bajo para el rojo y el azul; por lo tanto, NTSC muestra aproximadamente 350 píxeles de luminancia por línea de exploración, 150 píxeles de amarillo frente a verde y 50 píxeles de azul frente a rojo, que son proporcionales a los humanos. sensibilidad a cada componente.

Pérdida de información

Los formatos de compresión con pérdida sufren pérdida de generación: comprimir y descomprimir repetidamente el archivo hará que pierda calidad progresivamente. Esto contrasta con la compresión de datos sin pérdida, donde los datos no se perderán mediante el uso de dicho procedimiento. Los fundamentos teóricos de la información para la compresión de datos con pérdida son proporcionados por la teoría de distorsión de velocidad. Al igual que el uso de la probabilidad en la teoría de la codificación óptima, la teoría de la distorsión de la tasa se basa en gran medida en la estimación bayesiana y la teoría de la decisión para modelar la distorsión de la percepción e incluso el juicio estético.

Hay dos esquemas básicos de compresión con pérdida:

In lossy transformado codecs, las muestras de imagen o sonido se toman, se cortan en pequeños segmentos, se transforman en un nuevo espacio base, y se cuantifican. Los valores cuantificados resultantes son entonces entropía codificada.
In lossy predictive codecs, datos anteriores y/o posteriores decodificados se utiliza para predecir la muestra de sonido actual o el marco de imagen. El error entre los datos predichos y los datos reales, junto con cualquier información adicional necesaria para reproducir la predicción, se cuantifica y codifica.

En algunos sistemas, las dos técnicas se combinan y se utilizan códecs de transformación para comprimir las señales de error generadas por la etapa predictiva.

Comparación

La ventaja de los métodos con pérdida sobre los métodos sin pérdida es que, en algunos casos, un método con pérdida puede producir un archivo comprimido mucho más pequeño que cualquier método sin pérdida, sin dejar de cumplir los requisitos de la aplicación. Los métodos con pérdida se utilizan con mayor frecuencia para comprimir sonido, imágenes o videos. Esto se debe a que este tipo de datos están destinados a la interpretación humana, donde la mente puede "llenar los espacios en blanco" o ver errores o inconsistencias muy menores: idealmente, la compresión con pérdida es transparente (imperceptible), lo que se puede verificar a través de una prueba ABX. Los archivos de datos que usan compresión con pérdida son más pequeños y, por lo tanto, cuestan menos para almacenar y transmitir a través de Internet, una consideración crucial para los servicios de transmisión de video como Netflix y los servicios de transmisión de audio como Spotify.

Efectos emocionales

Un estudio realizado por Audio Engineering Library concluyó que los formatos de compresión con pérdida de velocidad de bits más baja (112 kbps), como los MP3, tienen efectos distintos en las características tímbricas y emocionales, y tienden a fortalecer las cualidades emocionales negativas y debilitar las positivas. El estudio señaló además que la trompeta es el instrumento más afectado por la compresión, mientras que la trompeta es la que menos.

Transparencia

Cuando un usuario adquiere un archivo comprimido con pérdidas (por ejemplo, para reducir el tiempo de descarga), el archivo recuperado puede ser bastante diferente del original en el nivel de bits, mientras que para la mayoría de los propósitos prácticos no se puede distinguir para el oído humano o el ojo humano. Muchos métodos de compresión se centran en las idiosincrasias de la fisiología humana, teniendo en cuenta, por ejemplo, que el ojo humano solo puede ver ciertas longitudes de onda de luz. El modelo psicoacústico describe cómo se puede comprimir mucho el sonido sin degradar la calidad percibida. Los defectos causados por la compresión con pérdida que son perceptibles para el ojo o el oído humanos se conocen como artefactos de compresión.

Relación de compresión

La relación de compresión (es decir, el tamaño del archivo comprimido en comparación con el del archivo sin comprimir) de los códecs de video con pérdida es casi siempre muy superior a la de los equivalentes de audio e imágenes fijas.

El vídeo se puede comprimir inmensamente (por ejemplo, 100:1) con poca pérdida de calidad visible
El audio a menudo se puede comprimir a las 10:1 con pérdida casi imperceptible de calidad
Todavía las imágenes se comprimen con frecuencia a las 10:1, como con el audio, pero la pérdida de calidad es más notable, especialmente en la inspección más cercana.

Transcodificación y edición

Una advertencia importante sobre la compresión con pérdida (transcodificación formal) es que la edición de archivos comprimidos con pérdida provoca la pérdida de generación digital de la recodificación. Esto se puede evitar produciendo solo archivos con pérdida a partir de originales (sin pérdida) y solo editando (copias de) archivos originales, como imágenes en formato de imagen sin procesar en lugar de JPEG. Si los datos que se han comprimido con pérdida se decodifican y comprimen sin pérdida, el tamaño del resultado puede ser comparable con el tamaño de los datos antes de la compresión con pérdida, pero los datos que ya se han perdido no se pueden recuperar. Al decidir utilizar la conversión con pérdida sin conservar el original, es posible que en el futuro sea necesaria la conversión de formato para lograr la compatibilidad con el software o los dispositivos (cambio de formato), o para evitar el pago de derechos de patente por la decodificación o distribución de archivos comprimidos.

Edición de archivos con pérdida

Al modificar los datos comprimidos directamente sin decodificarlos ni recodificarlos, es posible editar algunos archivos comprimidos con pérdidas sin degradar la calidad. A veces también es posible la edición que reduce el tamaño del archivo como si hubiera sido comprimido en mayor grado, pero sin más pérdida que esta.

JPEG

Los principales programas para la edición sin pérdida de archivos JPEG son jpegtran y el derivado exiftran (que también conserva la información Exif) y Jpegcrop (que proporciona una interfaz de Windows).

Estos permiten recortar, rotar, voltear y voltear la imagen, o incluso convertirla a escala de grises (eliminando el canal de crominancia). Mientras se destruye la información no deseada, la calidad de la parte restante no cambia.

Algunas otras transformaciones son posibles hasta cierto punto, como unir imágenes con la misma codificación (componer una al lado de la otra, como en una cuadrícula) o pegar imágenes como logotipos en imágenes existentes (ambos a través de Jpegjoin) o escalar.

Se pueden realizar algunos cambios en la compresión sin volver a codificar:

Optimización de la compresión (para reducir el tamaño sin cambio a la imagen decodificada)
Convertir entre la codificación progresiva y no progresiva.

El software gratuito IrfanView solo para Windows tiene algunas operaciones JPEG sin pérdida en su complemento JPG_TRANSFORM.

Metadatos

Los metadatos, como las etiquetas ID3, los comentarios de Vorbis o la información Exif, generalmente se pueden modificar o eliminar sin modificar los datos subyacentes.

Reducción de muestreo/escalabilidad de representación comprimida

Es posible que desee reducir la resolución de la señal de origen representada o disminuir la resolución de la señal de origen representada y la cantidad de datos utilizados para su representación comprimida sin volver a codificar, como en el pelado de tasa de bits, pero esta funcionalidad no es compatible con todos los diseños, ya que no todos los códecs codifican los datos en un formato que permite simplemente descartar los detalles menos importantes. Algunos diseños conocidos que tienen esta capacidad incluyen JPEG 2000 para imágenes fijas y codificación de video escalable basada en H.264/MPEG-4 AVC para video. Dichos esquemas también se han estandarizado para diseños más antiguos, como imágenes JPEG con codificación progresiva y video MPEG-2 y MPEG-4 Parte 2, aunque esos esquemas anteriores tuvieron un éxito limitado en términos de adopción en el uso común del mundo real. Sin esta capacidad, que suele ser el caso en la práctica, de producir una representación con una resolución más baja o una fidelidad más baja que una dada, se necesita comenzar con la señal fuente original y codificar, o comenzar con una representación comprimida y luego descomprimir y volver a codificar. -codificarlo (transcodificación), aunque esto último tiende a causar pérdida de generación digital.

Otro enfoque consiste en codificar la señal original a varias velocidades de bits diferentes y, a continuación, elegir cuál usar (como cuando se transmite por Internet, como en RealNetworks' "SureStream") u ofrecer distintas descargas, como en iTunes Store de Apple), o transmitir varios, donde se utiliza lo mejor que se recibe con éxito, como en varias implementaciones de modulación jerárquica. Se utilizan técnicas similares en mipmaps, representaciones piramidales y métodos de espacio de escala más sofisticados. Algunos formatos de audio presentan una combinación de un formato con pérdida y una corrección sin pérdida que, cuando se combinan, reproducen la señal original; la corrección se puede eliminar, dejando un archivo más pequeño y comprimido con pérdidas. Tales formatos incluyen MPEG-4 SLS (Scalable to Lossless), WavPack, OptimFROG DualStream y DTS-HD Master Audio en modo sin pérdidas (XLL).

Métodos

Gráficos

Imagen

Transformación cosina discreta (DCT)
- JPEG
- WebP (comprensión sin pérdida de alta densidad o pérdida de imágenes RGB y RGBA)
- Formato de imagen de alta eficiencia (HEIF)
- Mejores gráficos portátiles (BPG) (comprensión sin pérdida o pérdida)
- JPEG XR, sucesor de JPEG con soporte para gama alta de dinamismo, amplios formatos de píxeles gamut (comprsión sin pérdida o pérdida)
Compresión de onda
- JPEG 2000, formato sucesor de JPEG que utiliza ondas (complesión sin pérdida o pérdida)
- DjVu
- ICER, utilizado por los Mars Rovers, relacionados con JPEG 2000 en su uso de olas
- PGF, Archivo Gráficos Progresivos (comprensión sin pérdida o pérdida)
Compresión perceptual cartesiana, también conocida como CPC
Compresión fractal
JBIG2 (comprensión sin pérdida o pérdida)
compresión de textura S3TC para hardware gráfico 3D

Gráficos por computadora en 3D

glTF

Vídeo

Transformación cosina discreta (DCT)
- H.261
- Motion JPEG
- MPEG-1 Parte 2
- MPEG-2 Parte 2 (H.262)
- MPEG-4 Parte 2 (H.263)
- Codificación avanzada de vídeo (AVC / H.264 / MPEG-4 AVC) (también puede ser inofensivo, incluso en ciertas secciones de vídeo)
- Codificación de vídeo de alta eficiencia (HEVC / H.265)
- Ogg Theora (notado por su falta de restricciones de patentes)
- VC-1
Compresión de onda
- Motion JPEG 2000
- Dirac
Sorenson video codec

Sonido

Generales

Transformación de cosina discreta modificada (MDCT)
- Dolby Digital (AC-3)
- Adaptive Transform Acoustic Coding (ATRAC)
- MPEG Layer III (MP3)
- Codificación de audio avanzada (AAC / MP4 Audio)
- Vorbis
- Windows Media Audio (WMA) (Standard and Pro profiles are lossy. WMA Lossless también está disponible.)
- LDAC
- Opus (Notable por falta de restricciones de patentes, baja demora y alta calidad de habla y audio general.)
Modulación de código de pulso diferencial adaptativo (ADPCM)
- Master Quality Authenticated (MQA)
MPEG-1 Audio Layer II (MP2)
Musepack (basado en Musicam)
aptX/ aptX-HD

Discurso

Codificación predictiva lineal (LPC)
- Codificación predictiva adaptativa (APC)
- Predicción lineal excitada por el código (CELP)
- Predicción lineal excitada por código algebraico (ACELP)
- Relajado código-excitado predicción lineal (RCELP)
- CELP de bajo retraso (LD-CELP)
- Adaptive Multi-Rate (utilizado en GSM y 3GPP)
- Codec2 (notado por su falta de restricciones de patentes)
- Speex (notado por su falta de restricciones de patentes)
Transformación de cosina discreta modificada (MDCT)
- AAC-LD
- Constrained Energy Lapped Transform (CELT)
- Opus (principalmente para aplicaciones en tiempo real)

Otros datos

Los investigadores han realizado una compresión con pérdida de texto mediante el uso de un diccionario de sinónimos para sustituir las palabras largas por palabras cortas o técnicas de texto generativo, aunque a veces se incluyen en la categoría relacionada de conversión de datos con pérdida.

Bajar la resolución

Un tipo general de compresión con pérdida consiste en reducir la resolución de una imagen, como en el escalado de imágenes, en particular, la destrucción. También se puede eliminar menos "información inferior" partes de una imagen, como por tallado de costura. Muchas transformaciones de medios, como el desenfoque gaussiano, son, como la compresión con pérdida, irreversibles: la señal original no se puede reconstruir a partir de la señal transformada. Sin embargo, en general tendrán el mismo tamaño que el original y no son una forma de compresión. Reducir la resolución tiene usos prácticos, ya que la nave New Horizons de la NASA transmitió miniaturas de su encuentro con Plutón-Caronte antes de enviar las imágenes de mayor resolución. Otra solución para conexiones lentas es el uso de entrelazado de imágenes que define progresivamente la imagen. Por lo tanto, una transmisión parcial es suficiente para obtener una vista previa de la imagen final, en una versión de menor resolución, sin crear una versión a escala y también una completa.

Contenido relacionado

Más resultados...