Compressão com perda

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Baixa compressão (alta qualidade) JPEG

Alta compressão (baixa qualidade) JPEG

Na tecnologia da informação, compressão com perdas ou compressão irreversível é a classe de métodos de compressão de dados que usa aproximações inexatas e descarte parcial de dados para representar o conteúdo. Essas técnicas são usadas para reduzir o tamanho dos dados para armazenamento, manipulação e transmissão de conteúdo. As diferentes versões da foto do gato nesta página mostram como graus mais altos de aproximação criam imagens mais grosseiras à medida que mais detalhes são removidos. Isso se opõe à compactação de dados sem perdas (compactação de dados reversível) que não degrada os dados. A quantidade de redução de dados possível usando compactação com perdas é muito maior do que usando técnicas sem perdas.

A tecnologia de compactação com perdas bem projetada geralmente reduz significativamente o tamanho dos arquivos antes que a degradação seja percebida pelo usuário final. Mesmo quando perceptível pelo usuário, uma redução adicional de dados pode ser desejável (por exemplo, para comunicação em tempo real ou para reduzir tempos de transmissão ou necessidades de armazenamento). O algoritmo de compressão com perdas mais amplamente utilizado é a transformada discreta de cosseno (DCT), publicada pela primeira vez por Nasir Ahmed, T. Natarajan e K. R. Rao em 1974.

A compactação com perdas é mais comumente usada para compactar dados multimídia (áudio, vídeo e imagens), especialmente em aplicativos como streaming de mídia e telefonia via Internet. Por outro lado, a compactação sem perdas é normalmente necessária para arquivos de texto e dados, como registros bancários e artigos de texto. Pode ser vantajoso criar um arquivo mestre sem perdas que possa ser usado para produzir cópias adicionais. Isso permite evitar basear novas cópias compactadas em um arquivo de origem com perdas, o que resultaria em artefatos adicionais e mais perdas desnecessárias de informações.

Tipos

É possível compactar muitos tipos de dados digitais de forma a reduzir o tamanho de um arquivo de computador necessário para armazená-lo ou a largura de banda necessária para transmiti-lo, sem perda de todas as informações contidas no arquivo original. Uma imagem, por exemplo, é convertida em arquivo digital considerando-a como uma matriz de pontos e especificando a cor e o brilho de cada ponto. Se a imagem contiver uma área da mesma cor, ela poderá ser compactada sem perda, dizendo "200 pontos vermelhos" em vez de "red dot, red dot,...(mais 197 vezes)..., red dot."

Os dados originais contêm uma certa quantidade de informações e há um limite inferior para o tamanho do arquivo que pode conter todas as informações. A teoria da informação básica diz que há um limite absoluto na redução do tamanho desses dados. Quando os dados são compactados, sua entropia aumenta e não pode aumentar indefinidamente. Por exemplo, um arquivo ZIP compactado é menor que o original, mas compactar repetidamente o mesmo arquivo não reduzirá o tamanho a nada. A maioria dos algoritmos de compactação pode reconhecer quando uma compactação adicional seria inútil e, de fato, aumentaria o tamanho dos dados.

Em muitos casos, arquivos ou fluxos de dados contêm mais informações do que o necessário. Por exemplo, uma imagem pode ter mais detalhes do que o olho pode distinguir quando reproduzida no maior tamanho pretendido; da mesma forma, um arquivo de áudio não precisa de muitos detalhes finos durante uma passagem muito alta. Desenvolver técnicas de compressão com perdas o mais próximo possível da percepção humana é uma tarefa complexa. Às vezes, o ideal é um arquivo que forneça exatamente a mesma percepção do original, com o máximo possível de informações digitais removidas; outras vezes, a perda perceptível de qualidade é considerada uma compensação válida.

Os termos "irreversíveis" e "reversível" são preferidos em vez de "com perdas" e "sem perdas" respectivamente para algumas aplicações, como compactação de imagens médicas, para contornar as implicações negativas de "perda". O tipo e a quantidade de perda podem afetar a utilidade das imagens. Artefatos ou efeitos indesejáveis da compressão podem ser claramente discerníveis, mas o resultado ainda é útil para o propósito pretendido. Ou as imagens compactadas com perdas podem ser 'visualmente sem perdas' ou, no caso de imagens médicas, a chamada Compressão Irreversível Diagnosticamente Aceitável (DAIC) pode ter sido aplicada.

Transformar codificação

Algumas formas de compactação com perdas podem ser consideradas como uma aplicação de codificação de transformação, que é um tipo de compactação de dados usado para imagens digitais, sinais de áudio digital e vídeo digital. A transformação é normalmente usada para permitir uma quantização melhor (mais direcionada). O conhecimento do aplicativo é usado para escolher as informações a serem descartadas, diminuindo assim sua largura de banda. As informações restantes podem ser compactadas por meio de vários métodos. Quando a saída é decodificada, o resultado pode não ser idêntico à entrada original, mas espera-se que seja próximo o suficiente para o propósito do aplicativo.

A forma mais comum de compressão com perdas é um método de codificação de transformação, a transformada discreta de cosseno (DCT), que foi publicada pela primeira vez por Nasir Ahmed, T. Natarajan e K. R. Rao em 1974. DCT é a forma mais amplamente usada de com perdas compressão, para formatos populares de compressão de imagem (como JPEG), padrões de codificação de vídeo (como MPEG e H.264/AVC) e formatos de compressão de áudio (como MP3 e AAC).

No caso de dados de áudio, uma forma popular de codificação de transformação é a codificação perceptiva, que transforma os dados brutos em um domínio que reflete com mais precisão o conteúdo da informação. Por exemplo, em vez de expressar um arquivo de som como os níveis de amplitude ao longo do tempo, pode-se expressá-lo como o espectro de frequência ao longo do tempo, o que corresponde com mais precisão à percepção de áudio humana. Embora a redução de dados (compressão, seja com perdas ou sem perdas) seja um objetivo principal da codificação de transformação, ela também permite outros objetivos: pode-se representar dados com mais precisão para a quantidade original de espaço - por exemplo, em princípio, se começarmos com um mestre digital analógico ou de alta resolução, um arquivo MP3 de um determinado tamanho deve fornecer uma representação melhor do que um áudio bruto não compactado em arquivo WAV ou AIFF do mesmo tamanho. Isso ocorre porque o áudio não compactado só pode reduzir o tamanho do arquivo diminuindo a taxa de bits ou a profundidade, enquanto a compactação do áudio pode reduzir o tamanho, mantendo a taxa de bits e a profundidade. Essa compactação se torna uma perda seletiva dos dados menos significativos, em vez de perder dados em toda a placa. Além disso, uma codificação de transformação pode fornecer um domínio melhor para manipular ou editar os dados – por exemplo, a equalização do áudio é mais naturalmente expressa no domínio da frequência (aumentar os graves, por exemplo) em vez do domínio do tempo bruto.

Desse ponto de vista, a codificação perceptiva não é essencialmente sobre descartar dados, mas sim sobre uma melhor representação dos dados. Outro uso é para compatibilidade com versões anteriores e degradação normal: na televisão colorida, a codificação de cores por meio de um domínio de transformação de luminância-crominância (como YUV) significa que os conjuntos em preto e branco exibem a luminância, ignorando as informações de cores. Outro exemplo é a subamostragem de croma: o uso de espaços de cores como o YIQ, usado em NTSC, permite reduzir a resolução dos componentes de acordo com a percepção humana – os humanos têm resolução mais alta para preto e branco (luma), resolução mais baixa para cores de espectro médio, como amarelo e verde, e menor para vermelho e azul - assim, o NTSC exibe aproximadamente 350 pixels de luma por linha de varredura, 150 pixels de amarelo contra verde e 50 pixels de azul contra vermelho, que são proporcionais ao humano sensibilidade a cada componente.

Perda de informações

Formatos de compactação com perdas sofrem de perda de geração: compactar e descompactar repetidamente o arquivo fará com que ele perca qualidade progressivamente. Isso contrasta com a compactação de dados sem perdas, em que os dados não serão perdidos por meio do uso desse procedimento. Os fundamentos teóricos da informação para compactação de dados com perdas são fornecidos pela teoria da taxa de distorção. Muito parecido com o uso da probabilidade na teoria de codificação ideal, a teoria de distorção de taxa baseia-se fortemente na estimativa Bayesiana e na teoria da decisão para modelar a distorção perceptiva e até mesmo o julgamento estético.

Existem dois esquemas básicos de compactação com perdas:

Em codecs de transformação de perda, amostras de imagem ou som são tomadas, cortadas em pequenos segmentos, transformadas em um novo espaço de base e quantificadas. Os valores quantizados resultantes são então codificados por entropia.
Em codecs preditivos perdidos, dados decodificados anteriores e/ou subsequentes são usados para prever a amostra de som atual ou quadro de imagem. O erro entre os dados previstos e os dados reais, juntamente com qualquer informação extra necessária para reproduzir a previsão, é então quantificado e codificado.

Em alguns sistemas, as duas técnicas são combinadas, com codecs de transformação sendo usados para comprimir os sinais de erro gerados pelo estágio preditivo.

Comparação

A vantagem dos métodos com perdas sobre os métodos sem perdas é que, em alguns casos, um método com perdas pode produzir um arquivo compactado muito menor do que qualquer método sem perdas, enquanto ainda atende aos requisitos do aplicativo. Os métodos com perdas são usados com mais frequência para compactar som, imagens ou vídeos. Isso ocorre porque esses tipos de dados são destinados à interpretação humana, onde a mente pode facilmente "preencher os espaços em branco" ou ver além de erros ou inconsistências muito pequenos - idealmente, a compactação com perdas é transparente (imperceptível), o que pode ser verificado por meio de um teste ABX. Os arquivos de dados que usam compactação com perdas são menores em tamanho e, portanto, custam menos para armazenar e transmitir pela Internet, uma consideração crucial para serviços de streaming de vídeo, como Netflix e serviços de streaming de áudio, como Spotify.

Efeitos emocionais

Um estudo realizado pela Biblioteca de Engenharia de Áudio concluiu que formatos de compressão com perda de taxa de bits mais baixa (112 kbps), como MP3s, têm efeitos distintos nas características timbrais e emocionais, tendendo a fortalecer as qualidades emocionais negativas e enfraquecer as positivas. O estudo observou ainda que o trompete é o instrumento mais afetado pela compressão, enquanto a trompa é o menos afetado.

Transparência

Quando um usuário adquire um arquivo compactado com perdas (por exemplo, para reduzir o tempo de download), o arquivo recuperado pode ser bem diferente do original no nível de bits, embora seja indistinguível para o ouvido ou olho humano para fins mais práticos. Muitos métodos de compressão concentram-se nas idiossincrasias da fisiologia humana, levando em conta, por exemplo, que o olho humano pode ver apenas certos comprimentos de onda da luz. O modelo psicoacústico descreve como o som pode ser altamente comprimido sem degradar a qualidade percebida. Falhas causadas por compressão com perdas que são perceptíveis ao olho ou ouvido humano são conhecidas como artefatos de compressão.

Taxa de compressão

A taxa de compactação (ou seja, o tamanho do arquivo compactado em comparação com o arquivo não compactado) dos codecs de vídeo com perdas é quase sempre muito superior à dos equivalentes de áudio e imagem estática.

O vídeo pode ser comprimido imensamente (por exemplo, 100:1) com pouca perda de qualidade visível
Áudio muitas vezes pode ser comprimido em 10:1 com perda quase imperceptível de qualidade
Ainda as imagens são frequentemente comprimidas em 10:1, como com áudio, mas a perda de qualidade é mais perceptível, especialmente na inspeção mais próxima.

Transcodificação e edição

Uma ressalva importante sobre a compactação com perdas (formalmente transcodificação) é que a edição de arquivos compactados com perdas causa perda de geração digital a partir da recodificação. Isso pode ser evitado produzindo apenas arquivos com perdas de originais (sem perdas) e apenas editando (cópias de) arquivos originais, como imagens no formato de imagem bruta em vez de JPEG. Se os dados compactados com perdas forem decodificados e compactados sem perdas, o tamanho do resultado poderá ser comparável ao tamanho dos dados antes da compactação com perdas, mas os dados já perdidos não poderão ser recuperados. Ao decidir usar a conversão com perdas sem manter o original, a conversão de formato pode ser necessária no futuro para obter compatibilidade com software ou dispositivos (mudança de formato) ou para evitar o pagamento de royalties de patente para decodificação ou distribuição de arquivos compactados.

Edição de arquivos com perdas

Ao modificar os dados compactados diretamente sem decodificar e recodificar, é possível editar alguns arquivos compactados com perdas sem degradação da qualidade. A edição que reduz o tamanho do arquivo como se tivesse sido compactado em um grau maior, mas sem mais perda do que isso, às vezes também é possível.

JPEG

Os principais programas para edição sem perdas de JPEGs são jpegtran e o exiftran derivado (que também preserva informações Exif) e Jpegcrop (que fornece uma interface do Windows).

Eles permitem que a imagem seja cortada, girada, invertida e invertida, ou até mesmo convertida em escala de cinza (eliminando o canal de crominância). Enquanto as informações indesejadas são destruídas, a qualidade da parte restante permanece inalterada.

Algumas outras transformações são possíveis até certo ponto, como unir imagens com a mesma codificação (compondo lado a lado, como em uma grade) ou colar imagens como logotipos em imagens existentes (ambos via Jpegjoin) ou dimensionar.

Algumas alterações podem ser feitas na compactação sem recodificação:

Otimizando a compressão (para reduzir o tamanho sem mudança para a imagem decodificada)
Convertendo entre codificação progressiva e não progressista.

O IrfanView freeware somente para Windows tem algumas operações JPEG sem perdas em seu plug-in JPG_TRANSFORM.

Metadados

Os metadados, como tags ID3, comentários Vorbis ou informações Exif, geralmente podem ser modificados ou removidos sem modificar os dados subjacentes.

Downsampling/escalabilidade de representação compactada

Pode-se desejar reduzir a resolução ou diminuir a resolução do sinal de origem representado e a quantidade de dados usados para sua representação compactada sem recodificação, como no peeling de taxa de bits, mas essa funcionalidade não é suportada em todos os projetos, pois não todos os codecs codificam dados de uma forma que permite que detalhes menos importantes sejam simplesmente descartados. Alguns designs bem conhecidos que possuem esse recurso incluem JPEG 2000 para imagens estáticas e codificação de vídeo escalável baseada em H.264/MPEG-4 AVC para vídeo. Esses esquemas também foram padronizados para designs mais antigos, como imagens JPEG com codificação progressiva e vídeo MPEG-2 e MPEG-4 Parte 2, embora esses esquemas anteriores tivessem sucesso limitado em termos de adoção no uso comum do mundo real. Sem essa capacidade, que é frequentemente o caso na prática, de produzir uma representação com resolução ou fidelidade inferior a uma dada, é preciso começar com o sinal da fonte original e codificar, ou começar com uma representação compactada e depois descompactar e refazer -codifique-o (transcodificação), embora este último tenda a causar perda de geração digital.

Outra abordagem é codificar o sinal original em várias taxas de bits diferentes e, em seguida, escolher qual usar (como ao transmitir pela Internet - como no RealNetworks' "SureStream" - ou oferecer downloads variados, como na iTunes Store da Apple), ou difundir vários, onde se utiliza o que de melhor se recebe com sucesso, como em diversas implementações de modulação hierárquica. Técnicas semelhantes são usadas em mipmaps, representações em pirâmide e métodos de espaço de escala mais sofisticados. Alguns formatos de áudio apresentam uma combinação de um formato com perdas e uma correção sem perdas que, quando combinadas, reproduzem o sinal original; a correção pode ser removida, deixando um arquivo menor e compactado com perdas. Esses formatos incluem MPEG-4 SLS (Scalable to Lossless), WavPack, OptimFROG DualStream e DTS-HD Master Audio no modo lossless (XLL).

Métodos

Gráficos

Imagem

Transformação de cossena discreta (DCT)
- JPEG
- WebP (compressão sem perda de alta densidade ou perda de imagens RGB e RGBA)
- Formato de imagem de alta eficiência (HEIF)
- Melhores gráficos portáteis (BPG) (compressão sem perdas ou perda)
- JPEG XR, um sucessor de JPEG com suporte para alta gama dinâmica, formatos de pixel de gama larga (compressão perdida ou com perda)
Compressão de onda
- JPEG 2000, o formato sucessor do JPEG que usa wavelets (compressão perdida ou perdida)
- DjVu
- ICER, usado pelo Mars Rovers, relacionado ao JPEG 2000 em seu uso de wavelets
- PGF, Progressive Graphics File (compressão perdida ou perdida)
Compressão perceptual cartesiana, também conhecida como CPC
Compressão fractal
JBIG2 (compressão sem perdas ou perda)
Compressão de textura S3TC para hardware gráfico de computador 3D

Gráficos de computador 3D

glTF

Vídeo

Transformação de cossena discreta (DCT)
- H.261
- Motion JPEG
- MPEG-1 Parte 2
- MPEG-2 Parte 2 (H.262)
- MPEG-4 Parte 2 (H.263)
- Codificação de vídeo avançada (AVC / H.264 / MPEG-4 AVC) (também pode ser sem perda, mesmo em certas seções de vídeo)
- Codificação de vídeo de alta eficiência (HEVC / H.265)
- Ogg Theora (notado por sua falta de restrições de patente)
- VC-1
Compressão de onda
- Motion JPEG 2000
- Dirac.
Código de vídeo Sorenson

Áudio

Geral

Transformação de cosseina discreta modificada (MDCT)
- Dolby Digital (AC-3)
- Adaptive Transform Acoustic Coding (ATRAC)
- MPEG camada III (MP3)
- Codificação Avançada de Áudio (AAC / MP4 Audio)
- Vorbis
- Windows Media Audio (WMA) (Perfil padrão e Pro são perdidos. WMA Lossless também está disponível.)
- LDAC
- Opus (Notável por falta de restrições de patentes, atraso baixo e discurso de alta qualidade e áudio geral.)
Modulação de código de pulso diferencial adaptativo (ADPCM)
- Master Quality Autenticado (MQA)
MPEG-1 Audio Layer II (MP2)
Musepack (baseado em Musicam)
aptX/aptX-HD

Discurso

Codificação preditiva linear (LPC)
- Codificação preditiva adaptativa (APC)
- Previsões lineares com código (CELP)
- predição linear baseada em código algébraico (ACELP)
- Previsões lineares com código relaxado (RCELP)
- CELP de baixa renda (LD-CELP)
- Adaptive Multi-Rate (usado em GSM e 3GPP)
- Codec2 (notado por sua falta de restrições de patente)
- Speex (notado por sua falta de restrições de patente)
Transformação de cosseina discreta modificada (MDCT)
- AAC-LD
- Transformação de lavagem de energia restrita (CELT)
- Opus (principalmente para aplicações em tempo real)

Outros dados

Pesquisadores realizaram compactação com perdas em texto usando um dicionário de sinônimos para substituir palavras curtas por longas ou técnicas de texto generativo, embora algumas vezes caiam na categoria relacionada de conversão de dados com perdas.

Reduzindo a resolução

Um tipo geral de compactação com perdas é reduzir a resolução de uma imagem, como no dimensionamento da imagem, particularmente na decimação. Pode-se também remover menos "informações inferiores" partes de uma imagem, como por escultura de costura. Muitas transformações de mídia, como o desfoque Gaussiano, são, como a compressão com perdas, irreversíveis: o sinal original não pode ser reconstruído a partir do sinal transformado. No entanto, em geral, eles terão o mesmo tamanho do original e não são uma forma de compactação. A redução da resolução tem usos práticos, já que a nave da NASA New Horizons transmitiu miniaturas de seu encontro com Plutão-Caronte antes de enviar as imagens de resolução mais alta. Outra solução para conexões lentas é o uso do entrelaçamento de imagens que define progressivamente a imagem. Assim, uma transmissão parcial é suficiente para visualizar a imagem final, em uma versão de menor resolução, sem criar uma versão dimensionada e também uma versão completa.

Contenido relacionado

Más resultados...