Mojibake

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
O artigo da Wikipédia japonesa codificado UTF-8 para Mojibake exibido como se interpretado como Windows-1252
O artigo da Wikipédia russa codificada UTF-8 sobre a Igreja Slavonic exibido como se interpretado como KOI8-R

mojibake (japonês: 文字 化け ; iPA: [Mod͡ʑibake] , " Transformação do caractere ") é o texto ilegal ou sem sentido que é o resultado do texto sendo decodificado usando uma codificação de caracteres não intencionais. O resultado é uma substituição sistemática de símbolos por outros completamente não relacionados, geralmente de um sistema de escrita diferente.

Esta tela pode incluir o caractere de substituição genérica (" � 34;) em locais onde a representação binária é considerada inválida. Uma substituição também pode envolver vários símbolos consecutivos, como visto em uma codificação, quando o mesmo código binário constitui um símbolo na outra codificação. Isso ocorre devido à codificação de comprimento constante diferente (como nas codificações asiáticas de 16 bits versus codificações européias de 8 bits) ou o uso de codificações de comprimento variável (principalmente UTF-8 e UTF-16).

A falha na renderização dos glifos devido a fontes ausentes ou a falta de glifos em uma fonte é um problema diferente que não deve ser confundido com Mojibake. Os sintomas dessa renderização falhada incluem blocos com o ponto de código exibido em hexadecimal ou usando o caractere de substituição genérica. É importante ressaltar que essas substituições são válidas e são o resultado do tratamento de erros correto pelo software.

Causas

Para reproduzir corretamente o texto original que foi codificado, a correspondência entre os dados codificados e a noção de codificação deve ser preservada (ou seja, os padrões de codificação de origem e destino devem ser os mesmos). Como o Mojibake é o exemplo de não conformidade entre eles, ele pode ser alcançado manipulando os dados em si ou apenas relacionando-os.

Mojibake é frequentemente visto com dados de texto que foram marcados com uma codificação errada; Pode nem ser marcado, mas movido entre computadores com diferentes codificações padrão. Uma importante fonte de problema são os protocolos de comunicação que dependem de configurações em cada computador, em vez de enviar ou armazenar metadados juntamente com os dados.

As diferentes configurações padrão entre os computadores são em parte devido a diferentes implantações do Unicode entre as famílias de sistemas operacionais e em parte as codificações do Legacy ' Especializações para diferentes sistemas de escrita de idiomas humanos. Enquanto as distribuições do Linux foram alteradas principalmente para o UTF-8 em 2004, o Microsoft Windows geralmente usa o UTF-16 e, às vezes, usa páginas de código de 8 bits para arquivos de texto em diferentes linguagens.

Para alguns sistemas de escrita, como japoneses, várias codificações foram historicamente empregadas, fazendo com que os usuários vejam Mojibake com relativa frequência. Como exemplo, a palavra mojibake (" 文字 化け 化け 化け 化け 化け#34;) armazenada como euc-jp pode ser exibida incorretamente como " ハクサ � ス 、 ア ア ア ア ア " , " ハクサ嵂ス ア ア " (MS-932), ou " ハクサ郾ス ア ア " se interpretado como shift-jis, ou como " ê¸ »Ú² ½ ± " No software que assume que o texto esteja nas codificações Windows-1252 ou ISO 8859-1, geralmente rotuladas ocidental ou europeu ocidental . Isso é ainda exacerbado se outros locais estiverem envolvidos: o mesmo texto armazenado que o UTF-8 aparece como " 譁 � 蟄怜喧縺 � " se interpretado como shift-jis, como " æ-‡ Å-Åœ-–#34; se interpretado como ocidental, ou (por exemplo) como " 鏂囧 瓧 栥亼 栥亼 栥亼 " se interpretado como estando em um local de GBK (China continental).

Exemplo de Mojibake
Texto original ?
bytes brutos de codificação EUC-JP CAB8BBFAB2BDA4B1
EUC-JP bytes interpretado como Shift-JIS ??- Sim.PRESIDÊNCIA
bytes EUC-JP interpretados como GBK Efeitos
bytes EUC-JP interpretados como Windows-1252 ??»?21⁄2¤±
bytes brutos de codificação UTF-8 E69687E5ANÚNCIO97E58C96E38191
bytes UTF-8 interpretados como Shift-JIS
bytes UTF-8 interpretados como GBK
bytes UTF-8 interpretados como Windows-1252 æåSHIELDå??HOP'

Subespecífica

Se a codificação não for especificada, cabe ao software decidir por outros meios. Dependendo do tipo de software, a solução típica é a configuração ou as heurísticas de detecção de charset. Ambos são propensos a erradamente.

A codificação dos arquivos de texto é afetada pela configuração de localidade, que depende da linguagem do usuário, marca de sistema operacional e muitas outras condições. Portanto, a codificação assumida está sistematicamente errada para arquivos provenientes de um computador com uma configuração diferente, ou mesmo de um software localizado diferente no mesmo sistema. Para o Unicode, uma solução é usar uma marca de pedidos de bytes, mas para o código -fonte e outro texto legível por máquina, muitos analisadores não toleram isso. Outro está armazenando a codificação como metadados no sistema de arquivos. Os sistemas de arquivos que suportam atributos de arquivo estendidos podem armazenar isso como user.charset . Isso também requer suporte em software que deseja tirar proveito dele, mas não perturba outro software.

Embora algumas codificações sejam fáceis de detectar, como o UTF-8, há muitos que são difíceis de distinguir (consulte a detecção de charset). Um navegador da Web pode não ser capaz de distinguir uma página codificada no EUC-JP e outra em Shift-Jis se a codificação não for atribuída explicitamente usando cabeçalhos HTTP enviados junto com os documentos ou usando os meta tags do documento HTML que tags que tam são usados para substituir os cabeçalhos HTTP ausentes se o servidor não puder ser configurado para enviar os cabeçalhos HTTP adequados; Veja as codificações do personagem em HTML.

Especificação errada

Mojibake também ocorre quando a codificação é especificada incorretamente. Isso geralmente acontece entre as codificações semelhantes. Por exemplo, o Eudora Email Client para Windows era conhecido por enviar e-mails rotulados como ISO 8859-1 que, na realidade, Windows-1252. O Windows-1252 contém caracteres imprimíveis extras no intervalo C1 (os mais frequentemente vistos sendo aspas curvas e traços extras), que não foram exibidos corretamente no software em conformidade com o padrão ISO; Isso afetou especialmente o software em execução em outros sistemas operacionais, como o UNIX.

Supervisão do usuário

das codificações ainda em uso comum, muitas se originaram de tomar ASCII e anexá -lo ao topo; Como resultado, essas codificações são parcialmente compatíveis entre si. Exemplos disso incluem o Windows-1252 e a ISO 8859-1. Assim, as pessoas podem confundir o conjunto de codificação expandido que eles estão usando com ASCII simples.

Sobreespecífica

Quando existem camadas de protocolos, cada uma tentando especificar a codificação com base em informações diferentes, as menos informações podem ser enganosas para o destinatário. Por exemplo, considere um servidor da web que serve um arquivo HTML estático sobre HTTP. O conjunto de personagens pode ser comunicado ao cliente de várias maneiras:

  • no cabeçalho HTTP. Essas informações podem ser baseadas na configuração do servidor (por exemplo, ao servir um arquivo fora do disco) ou controladas pelo aplicativo em execução no servidor (para sites dinâmicos).
  • no arquivo, como uma meta tag HTML (http-equiv ou charset) ou o encoding atributo de uma declaração XML. Esta é a codificação que o autor queria salvar o arquivo em particular.
  • no arquivo, como uma marca de ordem byte. Esta é a codificação que o editor do autor realmente salvou-o. A menos que uma conversão acidental de codificação tenha acontecido (abrindo-a em uma codificação e salvando-a em outra), isso será correto. É, no entanto, apenas disponível em codificações Unicode, como UTF-8 ou UTF-16.

Falta de suporte de hardware ou software

O hardware muito mais antigo é normalmente projetado para suportar apenas um conjunto de caracteres e o conjunto de caracteres normalmente não pode ser alterado. A tabela de caracteres contida no firmware de exibição estará localizada para ter caracteres para o país em que o dispositivo deve ser vendido e, normalmente, a tabela difere de país para país. Como tal, esses sistemas poderão exibir mojibake ao carregar o texto gerado em um sistema de um país diferente. Da mesma forma, muitos sistemas operacionais iniciais não suportam vários formatos de codificação e, portanto, acabarão exibindo Mojibake se forem feitos para exibir texto não padrão-versões de Microsoft Windows e Palm OS, por exemplo, estão localizadas por país e apenas serão Padrões de codificação de suporte relevantes para o país em que a versão localizada será vendida e exibirá Mojibake se um arquivo que contém um texto em um formato de codificação diferente da versão que o sistema operacional for projetado para suportar for aberto.

Resolução

As aplicações usando UTF-8 como uma codificação padrão podem atingir um maior grau de interoperabilidade devido ao seu uso generalizado e compatibilidade com versões anteriores com US-ASCII. O UTF-8 também tem a capacidade de ser reconhecido diretamente por um algoritmo simples, para que o software bem escrito possa evitar misturar o UTF-8 com outras codificações.

A dificuldade de resolver uma instância de mojibake varia dependendo da aplicação em que ocorre e das causas dela. Dois dos aplicativos mais comuns nos quais o Mojibake pode ocorrer são navegadores da Web e processadores de texto. Os navegadores modernos e os processadores de texto geralmente suportam uma ampla gama de codificações de caráter. Os navegadores geralmente permitem que um usuário altere o mecanismo de renderização da configuração de codificação em tempo real, enquanto os processadores de texto permitem ao usuário selecionar a codificação apropriada ao abrir um arquivo. Pode levar alguma tentativa e erro para os usuários encontrarem a codificação correta.

O problema fica mais complicado quando ocorre em um aplicativo que normalmente não suporta uma ampla gama de codificação de caracteres, como em um jogo de computador não unicode. Nesse caso, o usuário deve alterar as configurações de codificação do sistema operacional para corresponder às do jogo. No entanto, a alteração das configurações de codificação em todo o sistema também pode causar mojibake em aplicações pré-existentes. No Windows XP ou posterior, um usuário também tem a opção de usar o Microsoft Applocale, um aplicativo que permite a alteração das configurações de localidade por aplicativo. Mesmo assim, a alteração das configurações de codificação do sistema operacional não é possível em sistemas operacionais anteriores, como o Windows 98; Para resolver esse problema nos sistemas operacionais anteriores, um usuário teria que usar aplicativos de renderização de fontes de terceiros.

Problemas em sistemas de escrita diferentes

Inglês

mojibake nos textos em inglês geralmente ocorre na pontuação, como os traços ( -), en traghes ( -) e citações encaracoladas (",", ','), mas raramente no texto do personagem, uma vez que a maioria das codificações concorda com ASCII sobre a codificação do alfabeto inglês. Por exemplo, o sinal de libra £ aparecerá como £ se for codificado pelo remetente como UTF-8, mas interpretado pelo destinatário como uma das codificações da Europa Ocidental ( CP1252 ou ISO 8859-1). Se iterado usando o CP1252, isso pode levar a £ , ã € € € ‚£ , ã ã ¢ € e assim por diante.

Da mesma forma, a cotação única certa ('), quando codificada no UTF-8 e decodificada usando o Windows-1252, torna-se â € , ¢ , Ã ¢

Nas épocas mais antigas, alguns computadores tinham codificações específicas de fornecedores que causaram incompatibilidade também para o texto em inglês. Os computadores de 8 bits da marca Commodore usaram a codificação PetSCII, particularmente notável para inverter a parte superior e inferior em comparação com o ASCII padrão. As impressoras PetScii funcionaram bem em outros computadores da época, mas inverteu o caso de todas as cartas. Os mainframes IBM usam a codificação EBCDIC que não corresponde a ASCII.

Outras línguas da Europa Ocidental

Os alfabetos das línguas norte -germânicas, catalã, romeno, finlandês, francês, alemão, italiano, português e espanhol são todas extensões do alfabeto latino. Os caracteres adicionais são tipicamente os que são corrompidos, tornando os textos apenas levemente ilegíveis com o Mojibake:

  • å, ä, ö em finlandês e sueco (š e ž estão presentes em alguns empréstimos finlandeses, é marginalmente em sueco, principalmente em palavras de empréstimo)
  • à, ç, è, é, ï, í, ò, ó, ú, ü em catalão
  • æ, ø, å em norueguês e dinamarquês, bem como acentos agudos opcionais em é etc para a desambiguação
  • , é, ó, ij, è, ë, ï em holandês
  • ä, ö, ü, e ß em alemão
  • , ð, í, ó, ú, ý, æ, ø em Faroese
  • Na Islândia
  • a, ç, è, é, ë, ê, ï, î, ô, ù, û, ü, ÿ, ÿ, æ, œ in French
  • a, è, é, ì, ò, ù em italiano
  • em espanhol
  • à, á, â, ã, ç, é, ê, í, ó, ô, õ, ú in Portuguese (ü no longer used)
  • ú em irlandês
  • à, è, ì, ò, ù em gaélico escocês
  • ă, î, ș, ț in Romanian
  • £ em Inglês Britânico (æ e œ raramente são usados)

... e suas contrapartes maiúsculas, se aplicável.

Estes são idiomas para os quais o conjunto de caracteres ISO 8859-1 (também conhecido como Latin 1 ou Western ) está em uso. No entanto, a ISO 8859-1 foi obsoleta por dois padrões concorrentes, o Windows-1252 compatível com versões anteriores e a ISO 8859-15 ligeiramente alterada. Ambos adicionam o sinal do euro e os franceses œ, mas, caso contrário, qualquer confusão desses três conjuntos de personagens não cria mojibake nesses idiomas. Além disso, é sempre seguro interpretar a ISO 8859-1 como Windows-1252 e bastante segura interpretá-lo como ISO 8859-15, em particular em relação ao sinal do euro, que substitui o sinal de moeda raramente usado (¤). No entanto, com o advento do UTF-8, o Mojibake se tornou mais comum em certos cenários, p. Troca de arquivos de texto entre os computadores do UNIX e do Windows, devido à incompatibilidade do UTF-8 com Latin-1 e Windows-1252. Mas o UTF-8 tem a capacidade de ser reconhecido diretamente por um algoritmo simples, para que o software bem escrito deve evitar misturar o UTF-8 com outras codificações, portanto, isso era mais comum quando muitos tinham software não suportando UTF-8. A maioria desses idiomas foi suportada pelo MS-DOS Padrão CP437 e outras codificações padrão da máquina, exceto ASCII, portanto, os problemas ao comprar uma versão do sistema operacional eram menos comuns. Windows e MS-DOS não são compatíveis, no entanto.

Em vogais suecas, norueguesas, dinamarquesas e alemãs, raramente são repetidas, e geralmente é óbvio quando um personagem é corrompido, por exemplo A segunda letra na palavra sueca kärlek (" amor " ;) quando é codificado no UTF-8, mas decodificado no oeste, produzindo "kã⁠ärlek" ou für em alemão, que se torna "für " . Dessa forma, mesmo que o leitor precise adivinhar qual é a carta original, quase todos os textos permanecem legíveis. Finlandês, por outro lado, freqüentemente usa vogais repetidas em palavras como hääyö ( " noite de casamento ") que pode dificultar a leitura do texto corrompido (por exemplo, hääyö aparece como como " O islandês tem dez personagens possivelmente confusos, e Faroese tem oito, tornando muitas palavras quase completamente ininteligíveis quando corrompidas (por exemplo, islandês Þjóðlöð , " Hospitalidade destacada ", aparece como como "

em alemão, Buchstabensalat (" Salada de carta " ;) é um termo comum para esse fenômeno, em espanhol, deformación (literalmente " deformação ") é usada e, em português, DesformatAção (literalmente " Deformating ") é usado.

Alguns usuários translitram sua escrita ao usar um computador, omitindo os diacríticos problemáticos ou usando substituições de diGraph (Å → Aa, ä/Æ æ → Ae, Ö/Ø → OE, ü → UE etc.). Assim, um autor pode escrever " Ueber " Em vez de "#34;"#34;, que é uma prática padrão em alemão quando os umlauts não estão disponíveis. A última prática parece ser melhor tolerada na esfera da língua alemã do que nos países nórdicos. Por exemplo, em norueguês, os digrafos estão associados a dinamarquês arcaicos e podem ser usados brincando. No entanto, os dígrafos são úteis na comunicação com outras partes do mundo. Como exemplo, o jogador de futebol norueguês Ole Gunnar Solskjær teve seu sobrenome escrito " Solskjaer " em seu uniforme quando ele jogou pelo Manchester United.

Um artefato de UTF-8 interpretado mal como ISO 8859-1, " " Sendo renderizado como "Ring Meg n ¥ ", foi visto em 2014 em um golpe de SMS direcionado à Noruega.

Exemplo suecoCodificação de fontesCodificação de alvosResultado
(Os ratos em vermelho estão incorretos.)
Smörgås
(suíche aberto)
MS-DOS 437ISO 8859-1Sm?rg†S
UTF-8Sm#rg?S
IBM/CP037 (EBCDIC)ë
Mac Roman.SmörgåS
ISO 8859-1Sm,rgÂS

O mesmo problema ocorre também em romeno, veja estes exemplos:


Exemplo romenoCodificação de fontesCodificação de alvosResultado
(Os ratos em vermelho estão incorretos.)
São Paulo
(más)
UTF-8
ASCIICenuÈ
ISO 8859-2CenuÇ
OEM 737Cenuββ Δ
Shift-JISCenuネ卞
TIS-620CenuO quê?
IBM/CP037 (EBCDIC)

Europa Central e Oriental

Os usuários de idiomas da Europa Central e Oriental também podem ser afetados. Como a maioria dos computadores não estava conectada a nenhuma rede durante o final da década de 1980, havia diferentes codificações de caracteres para cada idioma com caracteres diacríticos (ver ISO/IEC 8859 e KOI-8), geralmente também variando pelo sistema operacional.

Húngaro

Em húngaro, o fenômeno é referido como BETűSZEMÉT , Significado " Letra Garbage ". O húngaro tem sido particularmente suscetível, pois contém as letras acentuadas Á, é, Í, Ó, Ú, Ö, ü (todas presentes no conjunto de caracteres Latin-1), além dos dois caracteres ő e ű que não estão em latim-1-1 . Esses dois caracteres podem ser codificados corretamente no Latin-2, Windows-1250 e Unicode. No entanto, antes que o Unicode se tornasse comum em clientes de e-mail, os e-mails contendo texto húngaro geralmente tinham as cartas ő e ű corrompidas, às vezes ao ponto de irreconhecibilidade. É comum responder a um e-mail corrompido com a frase sem sentido " Árvíztűrő tükörfúrógép " (Literalmente " Máquina de perfuração espelhada resistente a inundações "), que contém todos os caracteres acentuados usados em húngaro.

Exemplos
Exemplo húngaroCodificação de fontesCodificação de alvosResultadoOcorrência
ÁRVÍZTRRP TÜKÖRFÚRÓGÉP
Anúncio grátis para sua empresa
UTF-8 Quoted-printable7-bit ASCII C3=81RVC3 = 8DZTC5 = B0RC5 = 90 TC3 = 9CKKC3 = 96RFC3 = 9ARC3-93GC3 = 89P C3 = A1rv- C3.O quê?C5 = B1RC5 = 91 )- C3 - C3kC3 = B6R.C3 = BARC3 = B3gC3 = A9p Principalmente causado por servidores de correio incorretamente configurados, mas pode ocorrer em mensagens SMS em alguns telefones celulares também.
ISO 8859-2 Quoted-printable = C1RV= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =ZT- BIDR= D5 T= DCKK= D6RF- Não.R= D3G= C9P
-E1rv=O quê?= FBR= F5 )= FFk= F6R.= FAR= F3g= E9p
CWI-2CP 437 ÅRV?ZTPRESIDÊNCIARo TÜKÖRFùR?GÉP
O que é isso??R? O que fazer?
A codificação CWI-2 foi projetada para que o texto húngaro permaneça bastante legível, mesmo que o dispositivo na extremidade receptora use uma das codificações padrão (CP 437 ou CP 850). Esta codificação foi usada muito fortemente entre o início da década de 1980 e o início da década de 1990, mas hoje em dia é completamente depreciada.
CP 852 RVZTδRè TÜKÖRFΘRαGÉP
O que é isso?R? O que fazer?
Isso foi muito comum nos dias do DOS, pois o texto foi muitas vezes codificado usando a página de código 852 ("European Central"), mas o software no fim receptor muitas vezes não apoiou o CP 852 e, em vez disso, tentou exibir texto usando CP 437 ou CP 850. As letras minúsculas são principalmente corretas, exceto para ű e ő. Ü/ü e Ö/ö estão corretas porque CP 437 e CP 850 foram feitas compatíveis com o alemão. Embora isso seja raro hoje em dia, ainda pode ser visto em locais como em prescrições e cheques impressos.
CP 850 ÁRVÍZT?Rè TÜKÖRFÚRÓGÉPRIO
O que é isso?1R? O que fazer?
Windows-1250 μRVÖZT?RS T?KKTMRFÉ um problema.R?G?P
rv:Gerenciamento de contas )?k"R.ŁR̆g?p
Ambas as codificações são da Europa Central, mas o texto é codificado com a codificação DOS e decodificado com a codificação do Windows. O uso do ű está correto.
Mac Roman. μRV÷ZTÇR T- Sim.KK?RFÈRG?P
rv°O quê?̊R? )Åk?R.- Não.R*gÇp
Também comum nos dias do DOS, isso pode ser visto quando os computadores da Apple tentaram exibir o texto húngaro enviado usando máquinas DOS ou Windows, pois eles muitas vezes padrão para a própria codificação da Apple.
Windows-1250 IRV?ZT€€R TKK÷RF?RG...P
·rv?O quê?̊R? )?k,R.;R- Sim.gÈp
CP 852 RVZTRŇ TKKIRFR?GP
ßrvIGerenciamento de contas# )Telecomunicaçõesk÷R.;R:gÚp
Ambas as codificações são da Europa Central, mas o texto é codificado com a codificação do Windows e decodificado com a codificação DOS. O uso do ű está correto.
Windows-1252 ÁRVÍZT- Sim.R? TÜKÖRFÚRÓGÉPRIO
O que é isso??R? O que fazer?
A codificação padrão do Windows da Europa Ocidental é usada em vez da central-europeia. Apenas ő-. (õ-.) e ű-. (û-š) estão errados, e o texto é completamente legível. Este é o erro mais comum hoje em dia; devido à ignorância, ocorre muitas vezes em páginas web ou mesmo em mídia impressa.
UTF-8 RVÀ vontadeZTÅRÅ TO quê?KK,RFNão.R"A"G(em inglês)P
?rv?O quê?ÅRÅ ' )1⁄4k#R.?RA3gEstá bem.p
Principalmente causada por serviços web ou clientes de webmail que são configurados incorretamente ou não testados para uso internacional (como o problema permanece oculto para textos em inglês). Neste caso, o conteúdo real (muitas vezes gerado) está em UTF-8, mas algum software mais antigo pode ser padrão para codificações localizadas se o UTF-8 não for explicitamente especificado nos cabeçalhos HTML.
Mac Roman. ÁRVÂZTŰR TÜKKÖRFÚRÓGÉP
√°rv√ CompetiçãoO quê??R )√°k√∂R.√∫R√≥g√©p

Polonês

Antes da criação da ISO 8859-2 em 1987, os usuários de várias plataformas de computação usaram suas próprias codificações de personagens, como o AmigaPl no Amiga, o Atari Club em Atari St e Masovia, IBM CP852, Mazovia e Windows CP1250 nos PCs IBM. Empresas poloneses que vendem os primeiros computadores do DOS criaram suas próprias maneiras mutuamente incompatíveis de codificar personagens polonês e simplesmente reprogramar os EPROMs das placas de vídeo (normalmente CGA, EGA ou Hercules) para fornecer páginas de código de hardware com os glifos necessários para o polimento-arbitrariamente localizado sem Referência a onde outros vendedores de computador os colocaram.

A situação começou a melhorar quando, após a pressão dos grupos acadêmicos e de usuários, a ISO 8859-2 foi bem-sucedida como o padrão da Internet " com apoio limitado dos fornecedores dominantes ' software (hoje em grande parte substituído pelo Unicode). Com os numerosos problemas causados pela variedade de codificações, ainda hoje alguns usuários tendem a se referir aos caracteres diacríticos polires como krzaczki ( [ˈkʂät͜ʂ.ki] , lit. " Little; arbustos ").

alfabetos russos e outros baseados em cirílicos

mojibake é chamado coloquialmente krakozyabry ( < span lang = "ru"> краtichз́́ры </span> </span> <span class = "ipa nowrap" lang = "ru-latn-fonipa"> [krɐkɐˈzʲæbrɪ̈] </span>) em russo, que foi e permanece complicado por vários sistemas para codificar cirílico. A União Soviética e o início da Federação Russa desenvolveram codificações KOI (<span title = "texto em língua russa"> <span lang = "ru-latn"> kod obmena informatsiey </span> </span>, <span title = "russo -Language Text "> <span lang =" ru "> ко обpel и и и и и иT"> к иеффацией </span> </span>, que se traduz em codificado para troca de informações "). Isso começou com o KOI7 de 7 bits apenas cirílico, baseado no ASCII, mas com latim e outros personagens substituídos por letras cirílicas. Então veio a codificação de Koi8 de 8 bits, que é uma extensão ASCII que codifica letras cirílicas apenas com octetos de alto bit, correspondentes a códigos de 7 bits de Koi7. É por esse motivo que o texto Koi8, mesmo russo, permanece parcialmente legível depois de tirar o oitavo bit, que foi considerado uma grande vantagem na idade de 8 anos de idade, sistemas de e-mail. Por exemplo, as palavras " <span title = "Texto da língua russa"> <span lang = "ru"> ш genо р ш ш шшу рш шшшу шшшу шшшу шшшуу шш ш шш шш шш ш ш ш ш ш ш ш ш rusian) <34; (<span title = "texto em língua russa"> <i lang = "ru-latn"> shkola russkogo yazyka </i> </span>), quando codificada em koi8 e passou pelo processo de remoção de bits, acabar sendo renderizado como " [Kola Russkogo Qzyka ". Eventualmente, o Koi8 ganhou sabores diferentes para russo e búlgaro (Koi8-R), ucraniano (Koi8-U), Bielorrusso (Koi8-Ru) e até Tajik (Koi8-T). </p><p> Enquanto isso, no oeste, o Código da Page 866 apoiava ucraniano e bielorrusso, além de russo e búlgaro no MS-DOS. Para o Microsoft Windows, o código da página 1251 adicionou suporte para variantes sérvias e outras eslavas do cirílico. </p><p> Mais recentemente, a codificação do Unicode inclui pontos de código para praticamente todos os caracteres em todos os idiomas, incluindo todos os caracteres cirílicos. </p><p> Antes do Unicode, era necessário corresponder a codificação de texto com uma fonte usando o mesmo sistema de codificação; Não fazer isso produzido sem ilegação, cuja aparência específica variava dependendo da combinação exata de texto e codificação de fontes. Por exemplo, tentando ver o texto cirílico não unicode usando uma fonte limitada ao alfabeto latino, ou usando o padrão (" Western ") codificando, normalmente resulta em texto que consiste quase inteiramente de vogais capitalizadas com Marcas diacríticas (por exemplo, Koi8 " <span title = "Texto da língua russa"> <span Lang = "Ru"> бииботperar Texto "> <i lang =" ru-latn "> biblioteka </i> </span>, biblioteca) torna-se "Texto em língua russa"> <i lang = "ru-latn"> shkola russkogo yazyka </i> </span>, escola de língua russa) torna-se " ûëïìá òõó ë € ñúùëá "). Usando o código página 1251 para visualizar o texto em koi8, ou vice -versa, resulta em texto distorcido que consiste principalmente em letras maiúsculas (koi8 e code 1251 compartilham a mesma região ASCII, mas o koi8 possui letras maiúsculas na região em que o código Page 1251 tem minúscula baixa e vice -versa). </p><p> Durante os primeiros anos do setor russo da World Wide Web, foram comuns o Koi8 e o Código. Quase todos os sites agora usam Unicode, mas em novembro de 2023, estima-se que 0,35% de todas as páginas da Web em todo o mundo-todos os idiomas incluídos-ainda estão codificados na página 1251, enquanto menos de 0,003% dos sites ainda estão codificados no KOI8-R. Embora o padrão HTML inclua a capacidade de especificar a codificação para qualquer página da Web em sua fonte, isso às vezes é negligenciado, forçando o usuário a alternar as codificações no navegador manualmente. </p><p> Em búlgaro, o mojibake é frequentemente chamado <span title = "texto da língua búlgara"> <i lang = "bg-latn"> majmunica </i> </span> (<span title = "texto búlgaro-língua-language "> <span lang =" bg "> майнница </span> </span>), significando" Monkey ' s [alfabeto] ". Em sérvio, é chamado <span title = "texto em língua sérvia"> <i lang = "sr-latn"> đubre </i> </span> (<title span = "texto sérvio-language"> <span Lang = "sr"> - - </span> </span>), significando " lixo ". Ao contrário da antiga URSS, os eslavos do sul nunca usaram algo como Koi8, e o código da codificação cirílico dominante antes do unicode; Portanto, esses idiomas sofreram menos problemas de incompatibilidade do que o russo. Na década de 1980, os computadores búlgaros usaram sua própria codificação MIK, que é superficialmente semelhante a (embora incompatível com) CP866. </p><table class="wikitable" style="text-align: center;"><caption>Exemplo </caption><tbody><tr><th>Texto original</th><th>Codificação de fontes</th><th>Codificação de alvos</th><th>Resultado </th></tr><tr><td rowspan="12" style="text-align: center;"><span title="Russian-language text"><span lang="ru">Telecomunicações</span></span></td></tr><tr><td>Windows-1251</td><td>KOI8-R</td><td>й й А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А </td></tr><tr><td rowspan="2">KOI8-R</td><td>Windows-1251</td><td>- Não. </td></tr><tr><td rowspan="4">Windows-1252</td><td>O que se passa? </td></tr><tr><td>MS-DOS 855</td><td>ÇO ÆÖO FORMAÇÃO </td></tr><tr><td>Windows-1251</td><td>O que é isso? </td></tr><tr><td rowspan="6">UTF-8</td><td>PRESIDÊNCIA: N. </td></tr><tr><td>KOI8-R</td><td>п─п─п─п─п─ппяпппп─п─я─я─я─я─я─я▀<br/><i>(O segundo personagem é um espaço não quebrado)</i></td></tr><tr><td>MS-DOS 855</td><td>лЛЛлл║л║л║л║лиЛлл▒ЛЛЛЛЛІ </td></tr><tr><td>Windows-1251</td><td>ССРРРРРРРРРРСРРРРРР СССЂР С±Р±Р±Р СРРРРРР СРРРР СРРРР СРР±Р±Р±Р± С±Р±Р±РР СРРРРРРР СРР±РРРРРРРР СРРРРР СР СРР± СРР±Р±РРРРРРР±РРРРРРРРР±РРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРР СР СР СР СРРР СРРР СР СРРР СРРРРР Р СРРРРР СРРР Р РРРРРРР РРРРР </td></tr><tr><td>Mac Roman.</td><td>–ö—Ä–∞–∫–æ–,—è–±— Ä </td></tr><tr><td>Mac Cyrillic</td><td>–А—А–∞–А–А–А—П–±—А—Л </td></tr></tbody></table><div class="mw-heading mw-heading4"><h4 id="Yugoslav_languages">Línguas jugoslavas</h4></div><p>Croatian, Bosnian, Serbian (the seceding varieties of Serbo-Croatian language) and Slovenian add to the basic Latin alphabet the letters š, đ, č, ć, ž, and their capital counterparts Š, Đ, Č, Ć, Ž (apenas Č/Č, Š/Š e Ž/Ž em Eslovena; oficialmente, embora outros sejam usados quando necessário, principalmente em nomes estrangeiros). Todas essas letras são definidas no Latin-2 e no Windows-1250, enquanto apenas algumas (Š, Š, Ž, Ž, đ) existem no Windows-1252 habitual de OS-default e estão lá por causa de alguns outros idiomas. </p><p> Embora o Mojibake possa ocorrer com qualquer um desses caracteres, as letras que não estão incluídas no Windows-1252 são muito mais propensas a erros. Assim, mesmo hoje em dia, " Šđ olhćž Šđčćž " é frequentemente exibido como "Šðèž Šðèæž ", embora, è, e æ nunca sejam usados em línguas eslavas. </p><p> Quando confinado ao ASCII básico (a maioria dos nomes de usuário, por exemplo), as substituições comuns são: Š → S, đ → DJ, Č → C, ć → C, Ž → Z (capital se forma analogamente, com đ → dj ou Đ → DJ, dependendo do caso do Word). Todas essas substituições introduzem ambiguidades, portanto, a reconstrução do original a partir desse formulário é geralmente feita manualmente, se necessário. </p><p> A codificação do Windows-1252 é importante porque as versões em inglês do sistema operacional Windows são mais difundidas, não localizadas. As razões para isso incluem um mercado relativamente pequeno e fragmentado, aumentando o preço da localização de alta qualidade, um alto grau de pirataria de software (por sua vez causado pelo alto preço do software em comparação com a renda), que desencoraja os esforços de localização, e as pessoas preferem versões em inglês de Windows e outro software. </p><p> O caminho para diferenciar croata de sérvio, bósnio de croata e sérvio e agora até montenegrina dos outros três cria muitos problemas. Existem muitas localizações diferentes, usando padrões diferentes e de qualidade diferente. Não há traduções comuns para a grande quantidade de terminologia do computador originária em inglês. No final, as pessoas usam palavras de empréstimos em inglês (" Kompjuter " para "Computador", Kompajlirati " para "compilação"; E se eles não estiverem acostumados aos termos traduzidos, eles podem não entender o que alguma opção em um menu deve fazer com base na frase traduzida. Portanto, as pessoas que entendem o inglês, assim como as que estão acostumadas à terminologia do inglês (que são mais, porque a terminologia do inglês também é ensinada principalmente nas escolas por causa desses problemas) escolhem regularmente as versões inglesas originais do software não especialista. </p><p> Quando o script cirílico é usado (para macedônio e parcialmente sérvio), o problema é semelhante a outros scripts baseados em cirílico. </p><p> Versões mais recentes das janelas em inglês permitem que a página de código seja alterada (as versões mais antigas exigem versões especiais em inglês com esse suporte), mas essa configuração pode ser e muitas vezes foi definida incorretamente. Por exemplo, o Windows 98 e o Windows ME podem ser definidos como a maioria das páginas de código de byte único não-de-direita à esquerda, incluindo 1250, mas apenas no horário de instalação. </p><div class="mw-heading mw-heading3"><h3 id="Caucasian_languages">Línguas caucasianas</h3></div><p> Os sistemas de escrita de certos idiomas da região do Cáucaso, incluindo os scripts da georgiana e armênia, podem produzir mojibake. Esse problema é particularmente agudo no caso de Armscii ou Armscii, um conjunto de codificações obsoletas de caracteres para o alfabeto armênio que foram substituídos pelos padrões Unicode. O ARMSCII não é amplamente utilizado devido à falta de apoio na indústria de computadores. Por exemplo, o Microsoft Windows não suporta. </p><div class="mw-heading mw-heading3"><h3 id="Asian_encodings">Codificações asiáticas</h3></div><p> Outro tipo de mojibake ocorre quando o texto codificado em uma codificação de um único byte é erroneamente analisado em uma codificação de vários bytes, como uma das codificações para idiomas do leste asiático. Com esse tipo de mojibake, mais de um (normalmente dois) caracteres são corrompidos de uma só vez. Por exemplo, se a palavra sueca <span title = "texto em língua sueca"> <i lang = "sv"> kärlek </i> </span> estiver codificada no Windows-1252, mas decodificada usando GBK, ele aparecerá como como aparecerá como " é analisado como '#34; 鋜 鋜 鋜 鋜 鋜 鋜#34;. Comparado ao mojibake acima, isso é mais difícil de ler, já que as cartas não relacionadas ao problemático Å, ä ou Ö estão ausentes e são especialmente problemáticas para palavras curtas, começando com Å, ä ou Ö (por exemplo, " än " torna -se " 鋘 鋘 鋘#34;). Como duas letras são combinadas, o mojibake também parece mais aleatório (mais de 50 variantes em comparação com os três normais, sem contar as capitais mais raras). Em alguns casos raros, uma sequência de texto inteira que inclui um padrão de comprimentos de palavras específicos, como a frase ", Bush escondeu os fatos" pode ser mal interpretada. </p><div class="mw-heading mw-heading4"><h4 id="Vietnamese">Vietnamita</h4></div><p> Em vietnamita, o fenômeno é chamado <i> chữ ma </i> (hán - nôm: 𡨸魔, " caracteres fantasmas ") ou <i> lOạn Mã (do chinês乱码, <i> luànmǎ </i>). Pode ocorrer quando um computador tenta decodificar o texto codificado no UTF-8 como Windows-1258, TCVN3 ou VNI. No Vietnã, <i> chữ ma </i> era comumente visto em computadores que executavam versões pré-vistas de janelas ou telefones celulares baratos. </p><table class="wikitable" style="text-align: center;"><caption></caption><tbody><tr><th>Exemplo</th><th>Codificação de fontes</th><th>Codificação de alvos</th><th>Resultado </th></tr><tr><td rowspan="5"><b>Anúncio grátis para sua empresa</b><br/><b>𤾓𢆥𥪞𡎝𠊛些</b><br/>(<i>Truyện Kiuu</i>, Nguyen Du) </td></tr><tr><td rowspan="4">UTF-8 </td><td>Windows-1258 </td><td>T.<span style="color: red;">?</span>MN<span style="color: red;">?</span>m trong c<span style="color: red;">μ</span>Ing<span style="color: red;">Eh!</span>Eu...<br/><span style="color: red;">PRESIDÊNCIA: S.A.</span></td></tr><tr><td>TCVN3 </td><td>T.<span style="color: red;">"</span>MN<span style="color: red;">"</span>m trong c<span style="color: red;">"</span>Ing<span style="color: red;">?</span>Eu...<br/><span style="color: red;">¥ ¥ ¥ ¥ ¥ ¥ ¥</span></td></tr><tr><td>VNI (Windows) </td><td>T.<span style="color: red;">a ser</span>MN<span style="color: red;">a ser</span>m trong c<span style="color: red;">O quê?</span>Ing<span style="color: red;">?</span>Eu...<br/><span style="color: red;"></span></td></tr><tr><td>Mac Roman. </td><td>T.<span style="color: red;">Ç</span>MN<span style="color: red;">Ç</span>m trong c<span style="color: red;">√μμ</span>Ing<span style="color: red;">Gerenciamento de contas</span>Eu...<br/><span style="color: red;">∫ ¢ ¢ Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫</span></td></tr></tbody></table><div class="mw-heading mw-heading4"><h4 id="Japanese">Japonês</h4></div><p> No Japão, o Mojibake é especialmente problemático, pois existem muitas codificações de texto japonês diferentes. Juntamente com as codificações Unicode (UTF-8 e UTF-16), existem outras codificações padrão, como Shift-Jis (Máquinas Windows) e EUC-JP (Sistemas UNIX). Até hoje, Mojibake é frequentemente encontrado pelo povo japonês e não japonês ao tentar executar software escrito para o mercado japonês. </p><table class="wikitable" style="text-align: center;"><caption></caption><tbody><tr><th>Texto original</th><th>Codificação de fontes</th><th>Codificação de alvos</th><th>Resultado </th></tr><tr><td rowspan="10"> のメールの様の様の様の様のメージす ジ 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 ジ ジ 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 </td></tr><tr><td rowspan="7">UTF-8 </td></tr><tr><td>UTF-7</td><td>Ø ( q Y _ C G b g) </td></tr><tr><td>EUC-JP</td><td>< < 若 吾 吾 吾 吾 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 </td></tr><tr><td>Shift-JIS</td><td>シ シシシフッッッ ァ∈∈ョョョ シシシクァァ€ </td></tr><tr><td>Mac Roman.</td><td>„ Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å </td></tr><tr><td>ISO 8859-6</td><td>ك ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ك ك ك ك ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه </td></tr><tr><td rowspan="3">Windows-1252</td><td>̄ ̄ ̄ ̄ ƒ ƒ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ </td></tr><tr><td>EUC-JP</td><td>¤ 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 Ç Ç Ç Ç Ç Ç Ç Ç £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ </td></tr><tr><td>Shift-JIS</td><td>¿Qué estás a falar? </td></tr></tbody></table><div class="mw-heading mw-heading4"><h4 id="Chinese">Chinês</h4></div><p> Em chinês, o mesmo fenômeno é chamado <i> luàn mǎ </i> (pinyin, chinês simplificado <span title = "texto em chinês"> <span lang = "zh-hans"> 乱码 </span > </span>, chinês tradicional <span title = "texto em língua chinesa"> <span lang = "zh-hant"> 亂碼 </span> </span>, significado ' código caótico ') , e pode ocorrer quando o texto computadorizado é codificado em uma codificação de caracteres chineses, mas é exibida usando a codificação errada. Quando isso ocorre, geralmente é possível corrigir o problema alternando a codificação do caractere sem perda de dados. A situação é complicada devido à existência de vários sistemas de codificação de caracteres chineses em uso, sendo os mais comuns: Unicode, Big5 e Guobiao (com várias versões compatíveis com atraso) e a possibilidade de caracteres chineses serem codificados usando a codificação japonesa. </p><p> É relativamente fácil identificar a codificação original quando <i> lu -nmǎ ocorre nas codificações de Guobiao: </p><table class="wikitable" style="text-align: center;"><tbody><tr><th>Texto original</th><th>Codificação de fontes</th><th>Codificação de alvos</th><th>Resultado</th><th>Nota </th></tr><tr><td>三國 </td><td>Grande. </td><td rowspan="3">GB </td><td><span style="color: red;"></span>Linha de produção </td><td>Personagens arquivados com quase nenhuma dica de significado original. O caráter vermelho não é um código válido em <span class="nowrap">GB 2312</span>. </td></tr><tr><td>文化ナステスト </td><td>Shift-JIS </td><td>暥帤壔偗僥僗僩 </td><td>Kana é exibido como caracteres com o : (chinês: <span lang="zh">人人旁</span>Não. <i><span lang="zh-Latn">Anúncio grátis para sua empresa</span></i>) radical, enquanto kanji são outros personagens. Muitos dos personagens substitutos são extremamente incomuns em chinês moderno. Um pouco fácil de identificar devido à presença de vários caracteres . consecutivos. </td></tr><tr><td>이 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 </td><td>EUC-KR </td><td>抛农聪墨 </td><td>Personagens simplificados aleatórios que na maioria dos casos não fazem sentido. Provavelmente o mais fácil de identificar por causa de espaços entre cada vários personagens. </td></tr></tbody></table><p> Um problema adicional em chinês ocorre quando caracteres raros ou antiquados, muitos dos quais ainda são usados em nomes pessoais ou de lugares, não existem em algumas codificações. Exemplos disso são: </p><ul><li>A falta de codificação Big5 do "s" (<i>xuan</i>) em nome do político taiwanês Wang Chien-shien (chinês: <span lang="zh-Hant">王建</span>Não. <i><span lang="zh-Latn">Wáng Jiànxuan</span></i>), o """ (<i>Não.</i>) em nome de Yu Shyi-kun (chinês simplificado: <span lang="zh-Hans">游</span>; chinês tradicional: <span lang="zh-Hant">O quê?</span>Não. <i><span lang="zh-Latn">Sim.</span></i>), e o """ (<i>zhé</i>) em nome do cantor David Tao (chinês: <span lang="zh-Hant">陶喆</span>Não. <i><span lang="zh-Latn">Táo Zhé</span></i>),</li><li>A falta de GB 2312 do "s" (<i>O quê?</i>) em ex-PRC Premier Zhu Rongji (chinês: <span lang="zh">朱镕基</span>Não. <i><span lang="zh-Latn">Zhū Róngjī</span></i>), e</li><li>A falta do símbolo de direitos autorais "©".</li></ul><p> Os jornais lidaram com caracteres ausentes de várias maneiras, incluindo o uso de software de edição de imagens para sintetizá -los combinando outros radicais e caracteres; Usando uma imagem das personalidades (no caso dos nomes das pessoas), ou simplesmente substituindo os homofones na esperança de que os leitores possam fazer a inferência correta. </p><div class="mw-heading mw-heading4"><h4 id="Indic_text">Texto indício</h4></div><p> Um efeito semelhante pode ocorrer em scripts brâmanes ou indicados do sul da Ásia, usados em idiomas indo-arianos ou indicadores como hindustani (hindi-urdu), bengali, punjabi, marathi e outros, mesmo que o conjunto de personagens seja empregado reconhecido corretamente pelo aplicativo. Isso ocorre porque, em muitos scripts indicados, as regras pelas quais os símbolos de cartas individuais se combinam para criar símbolos para sílabas podem não ser adequadamente entendidos por um computador que falta o software apropriado, mesmo que os glifos para os formulários de letra individuais estejam disponíveis. </p><p> Um exemplo disso é o antigo logotipo da Wikipedia, que tenta mostrar o personagem análogo a " Wi " (A primeira sílaba da Wikipedia ") Em cada uma das muitas peças do quebra -cabeça. A peça do quebra -cabeça destinada a suportar o personagem Devanagari por " Wi " Em vez disso, usado para exibir o " wa " Personagem seguido por um não pareado " i " vogal modificador, facilmente reconhecível como mojibake gerado por um computador não configurado para exibir texto indic. O logotipo tão redesenhado em maio de 2010 corrigiu esses erros. </p><p> A idéia do texto simples exige que o sistema operacional forneça uma fonte para exibir códigos Unicode. Essa fonte é diferente de OS para OS para Singhala e torna os glifos ortograficamente incorretos para algumas letras (sílabas) em todos os sistemas operacionais. Por exemplo, o ' Reph ', o formulário curto para ' r ' é um diacrítico que normalmente fica em cima de uma letra simples. No entanto, é errado ir ao topo de algumas cartas como ' YA ' ou ' la ' em contextos específicos. Para palavras ou nomes sânscríticos herdados por idiomas modernos, como कार्य, IAST: <i> kārya </i> ou आर्या, iAST: <i> āryā </i>, é adequado para colocá -lo em cima dessas letras . Por outro lado, para sons semelhantes em idiomas modernos que resultam de suas regras específicas, não é colocado no topo, como a palavra करणाऱ्या, iAST: <i> karaṇāryā </i>, uma forma de haste da palavra comum करणारा/ी ी gre , IAST: <i> karaṇārā/rī </i>, na língua marathi. Mas isso acontece na maioria dos sistemas operacionais. Isso parece ser uma falha da programação interna das fontes. Em Mac OS e iOS, o Muurdhaja L (Dark L) e ' U ' a combinação e sua forma longa produzem formas erradas. </p><p> Alguns scripts indic e indicados, principalmente o Laos, não foram oficialmente apoiados pelo Windows XP até o lançamento do Vista. No entanto, vários sites fizeram fontes gratuitas para baixar. </p><div class="mw-heading mw-heading4"><h4 id="Burmese">Birmânia</h4></div><p> Devido às sanções ocidentais e à chegada tardia do apoio à linguagem birmanesa em computadores, grande parte da localização do Birmânia foi caseira sem cooperação internacional. Os meios predominantes de apoio birmaneses são através da fonte Zawgyi, uma fonte criada como uma fonte Unicode, mas na verdade era de fato apenas parcialmente compatível com unicode. Na fonte de Zawgyi, alguns pontos de código para script birmaneses foram implementados conforme especificado no Unicode, mas outros não. O consórcio Unicode refere -se a isso como codificações de fontes <i> ad hoc </i>. Com o advento dos telefones celulares, fornecedores móveis como Samsung e Huawei simplesmente substituíram as fontes do sistema compatível com Unicode pelas versões Zawgyi. </p><p> Devido a essas codificações <i> ad hoc </i>, as comunicações entre usuários de Zawgyi e Unicode renderizariam como texto distorcido. Para contornar esse problema, os produtores de conteúdo faziam postagens em Zawgyi e Unicode. Governo de Mianmar designado em 1 de outubro de 2019 como 'U-Dia' " para mudar oficialmente para Unicode. A transição completa foi estimada em dois anos. </p><div class="mw-heading mw-heading3"><h3 id="African_languages">Línguas africanas</h3></div><p> Em certos sistemas de escrita da África, o texto não codificado é ilegível. Os textos que podem produzir mojibake incluem aqueles do chifre da África, como o script ge ' EZ na Etiópia e Eritreia, usado para amárico, tigre e outras línguas, e a língua somali, que emprega o alfabeto de Osmanya. Na África Austral, o alfabeto Mwangwego é usado para escrever idiomas do Malawi e o alfabeto de Mandombe foi criado para a República Democrática do Congo, mas estes geralmente não são apoiados. Vários outros sistemas de escrita nativos da África Ocidental apresentam problemas semelhantes, como o alfabeto n ' </p><div class="mw-heading mw-heading3"><h3 id="Arabic">Árabe</h3></div><p> Outra linguagem afetada é o árabe (veja abaixo), no qual o texto se torna completamente ilegível quando as codificações não correspondem. </p><div class="mw-heading mw-heading4"><h4 id="Examples_2">Exemplos</h4></div><table class="wikitable" style="text-align: center;"><tbody><tr class="hintergrundfarbe6"><th>Exemplo árabe</th><th>renderização do navegador</th><th>Codificação de fontes</th><th>Codificação de alvos</th><th>Resultado </th></tr><tr><td rowspan="16"><span typeof="mw:File"><span><img alt="" class="mw-file-element" data-file-height="12" data-file-width="136" decoding="async" height="12" src="https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/140px-Arabic_example.svg.png" srcset="https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/210px-Arabic_example.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/280px-Arabic_example.svg.png 2x" width="140"/></span></span><br/>(Declaração Universal dos Direitos Humanos) </td></tr><tr><td rowspan="15"><span title="Arabic-language text"><span dir="rtl" lang="ar">السان الالعالمي لحقوق الالان الان الان الان الان الان الان الان الالان ان الان الان ان ان ان ال ال ال ان ان ال ان ال ال ال ال ال ال ال ال ال ان ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ا ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ا ا ال </span></span></td></tr><tr><th rowspan="11">UTF-8</th><th>KOI8-R </th><td>ьььььььььььы├ь├ы├ы┴ь┬ь┬ь┬ы┴ы┴ы┴ ы┴ь┬ы┬ы┬ы┌ы┌ ь┌ььььььььы┌ ьы┌ы┌ ь ьььььы┌ы┌ ь ьь┌ы┌ ьь┌ьььь - Sim. </td></tr><tr><th>Windows-1250 </th><td>Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř ≤ Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř </td></tr><tr><th>Windows-1251 </th><td>Ш (em inglês) (em inglês) Ш§ШNoШ Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш </td></tr><tr><th>Windows-1252 </th><td>Ø Ø Ø Ø „ „ „ „ „ Ø Ù Ù Ù Ù ‚ ‚ ‚ Ø ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ † † † † ... ... ... ... „ „ „ „ „ „ „ </td></tr><tr><th>Windows-1256 </th><td>Consultado em 3 de outubro de 2013 «ط¥ط1ת طρظط§ ط§ ط§ ط§ ط§ ط§ ط§ ط§ ظطظת ‚镇 ط§ ‚ ظط§ط§ط§ ظط§ ط ظ ظطρظ ط ط ط ططρظ ط ط ططρظ ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط </td></tr><tr><th>ISO 8859-5 </th><td>й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й йй ий йй й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й </td></tr><tr><th>ISO 8859-6 </th><td>ظ ظ ظ ع ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ عظ عظ ع ع ع ظ ع ظ ع ظ ع ظ ع ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ </td></tr><tr><th>CP 852 </th><td>│ ć ć ć ć ć │ │ │ ć ć ě │ ě ě ě ć ć ć │ │ │ │ ć ć │ │ ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć </td></tr><tr><th>CP 866 </th><td>з зД╪ е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е ВД╪╣╪Д╪╣╪зДД┘Е┘Й ВДВнВВВИВ В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В Ж </td></tr><tr><th>Mac árabe </th><td>Consultado em 9 de outubro de 2014 عÑ SmartphoneظعÑ Smartphone'عÜ hood'عÑ Smartphone'عÑ عÑ Laptop-عÇ Consultado em 9 de outubro de 2014 hood'عÑ LaptopظعÜ </td></tr><tr><th rowspan="3">Mac Roman. </th><td>ÿ ÿ ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ Ÿ Ÿ Ÿ Ÿ Ÿ ≠ ≠ Ÿ Ÿ Ÿ ≠ ≠ ≠ Ÿ Ÿ ≠ ≠ Ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ Ÿ Ÿ Ÿ ≠ ≠ Ÿ Ÿ Ÿ ≠ ≠ ≠ Ÿ Ÿ Ÿ </td></tr><tr><th>Mac árabe </th><td>(em inglês) </td></tr><tr><th rowspan="2">Windows-1256 </th><td>«···················******************************************************************************************************************************************************************************************************************************************** </td></tr><tr><th>Windows-1252 </th><td>ÇáÅÚÁÇO ÇáÚÁUA FORMAÇÃO </td></tr></tbody></table><p> Os exemplos deste artigo não têm UTF-8 como configuração do navegador, porque o UTF-8 é facilmente reconhecível; portanto, se um navegador suportar UTF-8, deve reconhecê-lo automaticamente e não tentar interpretar outra coisa como UTF- 8. </p><div class="mw-heading mw-heading2"><h2 id="See_also">Ver também</h2></div><ul><li>Ponto de referência</li><li>Característica de substituição</li><li>Característica do substituto</li><li>Newline – As convenções para representar a quebra de linha diferem entre sistemas Windows e Unix. Embora a maioria dos softwares suporta ambas as convenções (que é trivial), software que deve preservar ou exibir a diferença (por exemplo, sistemas de controle de versão e ferramentas de comparação de dados) pode ficar substancialmente mais difícil de usar se não aderir a uma convenção.</li><li>Marca de ordem byte – A maneira mais em banda de armazenar a codificação junto com os dados - prepend it. Isto é pela intenção invisível para os seres humanos usando software compatível, mas será percebido por design como "personagens de criança" para software incompatível (incluindo muitos intérpretes).</li><li>entidades HTML – Uma codificação de caracteres especiais em HTML, principalmente opcional, mas necessário para certos caracteres escapar da interpretação como marcação. Embora a falha em aplicar esta transformação seja uma vulnerabilidade (ver scripting cross-site), aplicá-lo muitas vezes resulta em garbling desses caracteres. Por exemplo, a marca de cotação <code>"</code> torna-se <code>"</code>, <code>&quot;</code>, <code>&amp;quot;</code> e assim por diante.</li><li>Bush escondeu os fatos</li></ul><div class="mw-heading mw-heading2"><h2 id="References">Referências</h2></div><div class="reflist"><div class="mw-references-wrap mw-references-columns"><ol class="references"><li id="cite_note-ieee-1"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation journal cs1" id="CITEREFKing2012">King, Ritchie (2012). "O Unicode em breve será o código universal? [The Data]» (em inglês). <i>IEEE Spectrum</i>. <b>49</b> (7): 60. doi:10.1109/MSPEC.2012.6221090.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.jtitle=IEEE+Spectrum&rft.atitle=Will+unicode+soon+be+the+universal+code%3F+%26%2391%3BThe+Data%26%2393%3B&rft.volume=49&rft.issue=7&rft.pages=60&rft.date=2012&rft_id=info%3Adoi%2F10.1109%2FMSPEC.2012.6221090&rft.aulast=King&rft.aufirst=Ritchie&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-2"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1" id="CITEREFWINDISCHMANN2004">WINDISCHMANN, Stephan (31 de março de 2004). «curl -v linux.ars (Internationalization)» (em inglês). <i>Ars Technica</i><span class="reference-accessdate">. Retrieved <span class="nowrap">5 de Outubro</span> 2018</span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Ars+Technica&rft.atitle=curl+-v+linux.ars+%28Internationalization%29&rft.date=2004-03-31&rft.aulast=WINDISCHMANN&rft.aufirst=Stephan&rft_id=https%3A%2F%2Farstechnica.com%2Finformation-technology%2F2004%2F03%2Flinux-20040331%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-3"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Guidelines for extended atributos» (em inglês). 2013-05-17<span class="reference-accessdate">. Retrieved <span class="nowrap">2015-02-15</span></span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Guidelines+for+extended+attributes&rft.date=2013-05-17&rft_id=http%3A%2F%2Fwww.freedesktop.org%2Fwiki%2FCommonExtendedAttributes&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-4"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Unicode mailinglist on the Eudora email client» (em inglês). 2001-05-13<span class="reference-accessdate">. Retrieved <span class="nowrap">2014-11-01</span></span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Unicode+mailinglist+on+the+Eudora+email+client&rft.date=2001-05-13&rft_id=https%3A%2F%2Fwww.unicode.org%2Fmail-arch%2Funicode-ml%2Fy2001-m07%2F0355.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-5"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1 cs1-prop-foreign-lang-source">«sms-scam» (em norueguês). 18 de junho de 2014<span class="reference-accessdate">. Retrieved <span class="nowrap">19 de junho,</span> 2014</span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=sms-scam&rft.date=2014-06-18&rft_id=http%3A%2F%2Ftv2.no%2F2014%2F06%2F18%2Fnyheter%2F5718240&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-6"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text">p. 141, <i>Control + Alt + Delete: Um dicionário de Cyberslang</i>Jonathon Keats, Globe Pequot, 2007, ISBN 1-59921-039-8.</span></li><li id="cite_note-7"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Usage statistics of Windows-1251 for websites» (em inglês). <i>w3techs.com</i>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=w3techs.com&rft.atitle=Usage+statistics+of+Windows-1251+for+websites&rft_id=https%3A%2F%2Fw3techs.com%2Ftechnologies%2Fdetails%2Fen-windows1251&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-8"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Usage statistics of KOI8-R for websites» (em inglês). <i>w3techs.com</i>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=w3techs.com&rft.atitle=Usage+statistics+of+KOI8-R+for+websites&rft_id=https%3A%2F%2Fw3techs.com%2Ftechnologies%2Fdetails%2Fen-koi8r&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-9"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Declaring character encodings in HTML» (em inglês).</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Declaring+character+encodings+in+HTML&rft_id=https%3A%2F%2Fwww.w3schools.com%2FTAGs%2Fatt_meta_charset.asp&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-10"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«PRC GBK (XGB)» (em inglês). <i>Microsoft Microsoft</i>. Arquivado do original em 2002-10-01.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Microsoft&rft.atitle=PRC+GBK+%28XGB%29&rft_id=http%3A%2F%2Fwww.microsoft.com%2Ftypography%2Funicode%2F936.txt&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span> Mapa de conversão entre Código página 936 e Unicode. Precisa selecionar manualmente GB 18030 ou GBK no navegador para vê-lo corretamente.</span></li><li id="cite_note-NYTimes-11"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation news cs1" id="CITEREFCohen2007">Cohen, Noam (25 de junho de 2007). «Some Errors Defy Corrigs: A Typo in Wikipedia's Logo Fractures the Sanskrit» (em inglês). <i>The New York Times</i><span class="reference-accessdate">. Retrieved <span class="nowrap">17 de Julho</span> 2009</span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.jtitle=The+New+York+Times&rft.atitle=Some+Errors+Defy+Fixes%3A+A+Typo+in+Wikipedia%27s+Logo+Fractures+the+Sanskrit&rft.date=2007-06-25&rft.aulast=Cohen&rft.aufirst=Noam&rft_id=https%3A%2F%2Fwww.nytimes.com%2F2007%2F06%2F25%2Ftechnology%2F25wikipedia.html%3F_r%3D2%26oref%3Dslogin&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-12"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Marathi Typing | English to Marathi | Online Marathi Typing» (em inglês). <i>marathi.com.br</i><span class="reference-accessdate">. Retrieved <span class="nowrap">2022-08-02</span></span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=marathi.indiatyping.com&rft.atitle=Marathi+Typing+%7C+English+to+Marathi+%7C+Online+Marathi+Typing&rft_id=https%3A%2F%2Fmarathi.indiatyping.com%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-13"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Content Moved (Windows)» (em inglês). Msdn.microsoft.com<span class="reference-accessdate">. Retrieved <span class="nowrap">2014-02-05</span></span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Content+Moved+%28Windows%29&rft.pub=Msdn.microsoft.com&rft_id=http%3A%2F%2Fmsdn.microsoft.com%2Fen-us%2Flibrary%2Fms776260%28VS.85%29.aspx&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-japantimes-14"><span class="mw-cite-backlink">↑ a b</span> <span class="reference-text"><cite class="citation web cs1">«Unicode in, Zawgyi out: Modernity last catches up in Myanmar's digital world» (em inglês). <i>The Japan Times</i>. 27 de Setembro de 2019. Arquivado do original em 30 de setembro de 2019<span class="reference-accessdate">. Retrieved <span class="nowrap">24 de Dezembro</span> 2019</span>. <q>1 de outubro é "U-Day", quando Myanmar vai adotar oficialmente o novo sistema.... A Microsoft e a Apple ajudaram outros países a padronizar anos atrás, mas as sanções ocidentais significaram que Myanmar perdeu.</q></cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=The+Japan+Times&rft.atitle=Unicode+in%2C+Zawgyi+out%3A+Modernity+finally+catches+up+in+Myanmar%27s+digital+world&rft.date=2019-09-27&rft_id=https%3A%2F%2Fwww.japantimes.co.jp%2Fnews%2F2019%2F09%2F27%2Fbusiness%2Ftech%2Funicode-in-zawgyi-out-myanmar%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-griffin-15"><span class="mw-cite-backlink">↑ a b</span> <span class="reference-text"><cite class="citation web cs1" id="CITEREFHotchkiss2016">Hotchkiss, Griffin (23 de março de 2016). «Battle of the fonts». <i>Fronteira Myanmar</i><span class="reference-accessdate">. Retrieved <span class="nowrap">24 de Dezembro</span> 2019</span>. <q>Com o lançamento do pacote de serviços do Windows XP 2, scripts complexos foram suportados, o que tornou possível para o Windows renderizar uma fonte Burmese compatível com Unicode, como Myanmar1 (lançado em 2005).... Myazedi, BIT, e mais tarde Zawgyi, circunscreveu o problema de renderização adicionando pontos de código extra que foram reservados para as línguas étnicas de Myanmar. Não só o re-mapping impede o apoio à linguagem étnica futura, também resulta em um sistema de digitação que pode ser confuso e ineficiente, mesmo para usuários experientes.... Huawei e Samsung, as duas marcas de smartphones mais populares em Myanmar, são motivadas apenas capturando a maior quota de mercado, o que significa que eles suportam Zawgyi fora da caixa.</q></cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Frontier+Myanmar&rft.atitle=Battle+of+the+fonts&rft.date=2016-03-23&rft.aulast=Hotchkiss&rft.aufirst=Griffin&rft_id=https%3A%2F%2Ffrontiermyanmar.net%2Fen%2Ffeatures%2Fbattle-of-the-fonts&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-sin-16"><span class="mw-cite-backlink">↑ a b</span> <span class="reference-text"><cite class="citation web cs1" id="CITEREFSin2019">Sin, Thant (7 de setembro de 2019). «Unified under one font system as Myanmar prepares to migrate from Zawgyi to Unicode» (em inglês). <i>Vozes crescentes</i><span class="reference-accessdate">. Retrieved <span class="nowrap">24 de Dezembro</span> 2019</span>. <q>Padrão Myanmar Fontes Unicode nunca foram mainstreamed ao contrário da fonte privada e parcialmente compatível com Unicode Zawgyi.... Unicode irá melhorar o processamento de linguagem natural</q></cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Rising+Voices&rft.atitle=Unified+under+one+font+system+as+Myanmar+prepares+to+migrate+from+Zawgyi+to+Unicode&rft.date=2019-09-07&rft.aulast=Sin&rft.aufirst=Thant&rft_id=https%3A%2F%2Frising.globalvoices.org%2Fblog%2F2019%2F09%2F06%2Funified-under-one-font-system-as-myanmar-prepares-to-migrate-from-zawgyi-to-unicode%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-17"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Why Unicode is Needed» (em inglês). <i>Código do Google: Projeto Zawgyi</i><span class="reference-accessdate">. Retrieved <span class="nowrap">31 de Outubro</span> 2013</span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Google+Code%3A+Zawgyi+Project&rft.atitle=Why+Unicode+is+Needed&rft_id=https%3A%2F%2Fcode.google.com%2Fp%2Fzawgyi%2Fwiki%2FWhyUnicode&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-unicode_faq-18"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1">«Myanmar Scripts and Languages» (em inglês). <i>Perguntas frequentes</i>. Consórcio de Unicode<span class="reference-accessdate">. Retrieved <span class="nowrap">24 de Dezembro</span> 2019</span>. <q><span class="cs1-kern-left"></span>"UTF-8" tecnicamente não se aplica às codificações de fontes ad hoc, como Zawgyi.</q></cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Frequently+Asked+Questions&rft.atitle=Myanmar+Scripts+and+Languages&rft_id=https%3A%2F%2Fwww.unicode.org%2Ffaq%2Fmyanmar.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-fb_eng-19"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1" id="CITEREFLaGrowPruzan2019">LaGrow, Nick; Pruzan, Miri (26 de setembro de 2019). «Integrating autoconversion: Facebook's path from Zawgyi to Unicode - Facebook Engineering» (em inglês). <i>Engenharia do Facebook</i>. Facebook<span class="reference-accessdate">. Retrieved <span class="nowrap">25 de Dezembro</span> 2019</span>. <q>Ele torna a comunicação em plataformas digitais difíceis, como o conteúdo escrito em Unicode aparece enfeitado para os usuários Zawgyi e vice-versa.... A fim de melhor alcançar seus públicos, os produtores de conteúdo em Myanmar frequentemente postam em Zawgyi e Unicode em um único post, para não mencionar inglês ou outros idiomas.</q></cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Facebook+Engineering&rft.atitle=Integrating+autoconversion%3A+Facebook%27s+path+from+Zawgyi+to+Unicode+-+Facebook+Engineering&rft.date=2019-09-26&rft.aulast=LaGrow&rft.aufirst=Nick&rft.au=Pruzan%2C+Miri&rft_id=https%3A%2F%2Fengineering.fb.com%2Fandroid%2Funicode-font-converter%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li><li id="cite_note-mmti_Myan-20"><span class="mw-cite-backlink"><b>^</b></span> <span class="reference-text"><cite class="citation web cs1" id="CITEREFSaw_Yi_Nanda2019">Saw Yi Nanda (21 de novembro de 2019). «Myanmar switch to Unicode to take two years: app developer» (em inglês). <i>The Myanmar Times</i>. Arquivado do original em 24 de dezembro de 2019<span class="reference-accessdate">. Retrieved <span class="nowrap">24 de Dezembro</span> 2019</span>.</cite><span class="Z3988" title="ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=The+Myanmar+Times&rft.atitle=Myanmar+switch+to+Unicode+to+take+two+years%3A+app+developer&rft.date=2019-11-21&rft.au=Saw+Yi+Nanda&rft_id=https%3A%2F%2Fwww.mmtimes.com%2Fnews%2Fmyanmar-switch-unicode-take-two-years-app-developer.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake"></span></span></li></ol></div></div><div class="mw-heading mw-heading2"><h2 id="External_links">Ligações externas</h2></div><ul><li><span class="noviewer" typeof="mw:File"><a class="mw-file-description" href="https://en.wikipedia.org/wiki/File:Wiktionary-logo-en-v2.svg"><img alt="" class="mw-file-element" data-file-height="512" data-file-width="512" decoding="async" height="16" src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/16px-Wiktionary-logo-en-v2.svg.png" srcset="https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/24px-Wiktionary-logo-en-v2.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/32px-Wiktionary-logo-en-v2.svg.png 2x" width="16"/></a></span> A definição de dicionário de mojibake em Wiktionary</li><li><span class="noviewer" typeof="mw:File"><a class="mw-file-description" href="https://en.wikipedia.org/wiki/File:Commons-logo.svg"><img alt="" class="mw-file-element" data-file-height="1376" data-file-width="1024" decoding="async" height="16" src="https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/12px-Commons-logo.svg.png" srcset="https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/18px-Commons-logo.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/24px-Commons-logo.svg.png 2x" width="12"/></a></span> Mídia relacionada ao Mojibake no Wikimedia Commons</li></ul><div class="navbox-styles"></div><div aria-labelledby="Character_encodings" class="navbox" role="navigation" style="padding:3px"><table class="nowraplinks mw-collapsible autocollapse navbox-inner" style="border-spacing:0;background:transparent;color:inherit"><tbody><tr><th class="navbox-title" colspan="2" scope="col"><div class="navbar plainlinks hlist navbar-mini"><ul><li class="nv-view">v</li><li class="nv-talk">)</li><li class="nv-edit">e</li></ul></div><div id="Character_encodings" style="font-size:114%;margin:0 4em">Codificações de caracteres</div></th></tr><tr><th class="navbox-group" scope="row" style="width:1%">Telecomunicações</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Código do telegrama <ul><li>Agulha</li><li>Morse <ul><li>Não latina</li><li>Wabun/Kana</li><li>Chinês</li><li>Cyrillic</li></ul></li><li>Baudot e Murray</li></ul></li><li>Campo de batalha</li><li>ASCII <ul><li>ISO/IEC 646</li></ul></li><li>BCDIC</li><li>Teletex e Videotex/Teletext <ul><li>T.51/ISO/IEC 6937</li><li>ITU T.61</li><li>ITU T.101</li><li>Teletexto do Sistema Mundial <ul><li>fundo</li><li>conjuntos</li></ul></li></ul></li><li>Código de transmissão</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">ISO/IEC 8859</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Peças aprovadas <ul><li>-1 (Europa Ocidental)</li><li>-2 (Europa Central)</li><li>-3 (Maltese/Esperanto)</li><li>-4 (Europa do Norte)</li><li>-5 (cirílico)</li><li>-6 (árabe)</li><li>-7 (em grego)</li><li>-8 (Hebreus)</li><li>-9 (Turquia)</li><li>-10 (Nordic)</li><li>-11 (Thai)</li><li>-13 (háltico)</li><li>-14 (Celtic)</li><li>-15 (Nova Europa Ocidental)</li><li>-16 (Romeno)</li></ul></li><li>Peças abandonadas <ul><li>-12 (Devanagari)</li></ul></li><li>Proposto mas não aprovado <ul><li>KOI-8 Cyrillic</li><li>Sámi</li></ul></li><li>Adaptações <ul><li>Gales</li><li>Barents Cyrillic</li><li>Estônia</li><li>Cirilo ucraniano</li></ul></li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Uso bibliográfico</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>MARC-8 <ul><li>ANSEL</li><li>CCCII/EACC</li></ul></li><li>ISO 5426</li><li>5426-2</li><li>5427</li><li>5428</li><li>6438</li><li>6862</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Normas nacionais</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>ArmSCII</li><li>Grande.</li><li>Braços</li><li>CNS 11643</li><li>DIN 66003</li><li>ELE 927</li><li>GOST 10859</li><li>GB 2312</li><li>GB 12345</li><li>GB 12052</li><li>GB 18030</li><li>HKSCS</li><li>ISCII</li><li>JIS X 0201</li><li>JIS X 0208</li><li>JIS X 0212</li><li>JIS X 0213</li><li>KOI-7</li><li>KPS 9566</li><li>KS X 1001</li><li>KS X 1002</li><li>LST 1564</li><li>LST 1590-4</li><li>PASCAL</li><li>Shift JIS</li><li>SI 960</li><li>TIS-620</li><li>TSCII</li><li>VISCAL</li><li>VSCII</li><li>YUSCII</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">ISO/IEC 2022</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>ISO/IEC 8859</li><li>ISO/IEC 10367</li><li>Código Unix estendido / EUC</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Mac OS Páginas de código<br/>("scripts")</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Arménio</li><li>Árabe</li><li>Barents Cyrillic</li><li>Celta</li><li>Central Europeu</li><li>Croata</li><li>Cyrillic</li><li>Devanagari</li><li>Farsi (Persa)</li><li>Fonte X (Kermit)</li><li>Gaélico</li><li>Geórgia</li><li>Grego</li><li>Gujardo</li><li>Produtos de plástico</li><li>Hebraico</li><li>Islândia</li><li>Inútil</li><li>Teclado</li><li>Latim (Kermit)</li><li>Maltese/Esperanto</li><li>Ogham</li><li>Romano</li><li>Romeno</li><li>Sámi</li><li>Turco turco</li><li>Cirílico Turco</li><li>Ucrânia</li><li>VT100</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">páginas de código DOS</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>437</li><li>668</li><li>708</li><li>720</li><li>737</li><li>770</li><li>773</li><li>775</li><li>776</li><li>777</li><li>778</li><li>850</li><li>851</li><li>852</li><li>853</li><li>855</li><li>856</li><li>857</li><li>858</li><li>859</li><li>860</li><li>861</li><li>862</li><li>863</li><li>864</li><li>865</li><li>866</li><li>867</li><li>868</li><li>869</li><li>897</li><li>899</li><li>903</li><li>904</li><li>932</li><li>936</li><li>942</li><li>949</li><li>950</li><li>951</li><li>1034</li><li>1040</li><li>1042</li><li>1043</li><li>1044</li><li>1098</li><li>1115</li><li>1116</li><li>1117</li><li>1118</li><li>1127</li><li>3846</li><li>ABICOMP</li><li>CS Indic</li><li>CSX Índio</li><li>CSX+ Indic</li><li>CWI-2</li><li>Sistema do Irã</li><li>Kamenicky</li><li>Mazovia</li><li>MIK</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Páginas de código IBM AIX</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>895</li><li>896</li><li>912</li><li>915</li><li>921</li><li>92</li><li>1006</li><li>1008</li><li>1009</li><li>1010</li><li>1012</li><li>1013</li><li>1014</li><li>1015</li><li>1016</li><li>1017</li><li>1018</li><li>1019</li><li>1046</li><li>1124</li><li>1133</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Páginas de código do Windows</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>CER-GS</li><li>932</li><li>936 (GBK)</li><li>950</li><li>1169</li><li>Latim estendido... 8</li><li>1250</li><li>1251</li><li>1252</li><li>1253</li><li>1254</li><li>1255</li><li>1256</li><li>1257</li><li>1258</li><li>1270</li><li>Cirílico + Finlandês</li><li>Cirílico + Francês</li><li>Cirílico + Alemão</li><li>Grego politico</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Páginas de código EBCDIC</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Língua japonesa em EBCDIC</li><li>DKOI</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Terminais DEC (VTx)</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Multinacional (MCS)</li><li>Substituição Nacional (NRCS) <ul><li>Francês canadense</li><li>Suíça</li><li>Espanhol</li><li>Reino Unido</li><li>Países Baixos</li><li>Finlândia</li><li>Francês</li><li>Norueguês e Dinamarquês</li><li>Sueco</li><li>Norueguês e Dinamarquês (alternativa)</li></ul></li><li>8-bit grego</li><li>Turco de 8 bits</li><li>SI 960</li><li>Hebraico</li><li>Gráficos especiais</li><li>Técnico (TCS)</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Plataforma específica</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>1052</li><li>1053</li><li>1054</li><li>1055</li><li>1056</li><li>1057</li><li>1058</li><li>Acorn RISC OS</li><li>CPC Amstrad</li><li>Apple II</li><li>ATASCII</li><li>Atari ST</li><li>BICS</li><li>Cálcio calculadoras</li><li>CDC</li><li>Compucolor 8001</li><li>Compucolor II</li><li>CP/M+</li><li>DEC RADIX 50</li><li>DEC MCS/NRCS</li><li>DG Internacional</li><li>Festas de Aniversário</li><li>GEM</li><li>GSM 03.38</li><li>HP Roman</li><li>HP FOCAL</li><li>HP RPL</li><li>SQUOZE</li><li>LICS</li><li>LMBCS</li><li>MSX</li><li>NEC APC</li><li>NeXT</li><li>PETSCII</li><li>Padrão PostScript</li><li>PostScript Latin 1</li><li>SAM Coupé</li><li>Sega SC-3000</li><li>Calculadoras afiadas</li><li>Sharp MZ</li><li>Sinclair QL</li><li>Teletexto</li><li>Calculadoras TI</li><li>TRS-80</li><li>Ventura Internacional</li><li>WISCII</li><li>XCCS</li><li>ZX80</li><li>ZX81</li><li>Espectro de ZX</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Unicode / ISO/IEC 10646</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>UTF-1</li><li>UTF-7</li><li>UTF-8</li><li>UTF-16</li><li>UTF-32</li><li>UTF-EBCDIC</li><li>GB 18030</li><li>DIN 91379</li><li>BOCU-1</li><li>CESÍ87</li><li>SCSU</li><li>TACE16</li><li>Comparação de codificação Unicode</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Sistema de tipoção TeX</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Cortiça</li><li>LY1</li><li>OML</li><li>OMS</li><li>OT1</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Várias páginas de código</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>ABICOMP</li><li>ASMO 449</li><li>Codificação digital de símbolos APL <ul><li>ISO-IR-68</li></ul></li><li>ARIB STD-B24</li><li>Campo de batalha</li><li>HZ</li><li>IEC-P27-1</li><li>INIS <ul><li>7 bits</li><li>8 bits</li></ul></li><li>ISO-IR-169</li><li>ISO 2033</li><li>KOI <ul><li>KOI8-R</li><li>KOI8-RU</li><li>KOI8-U</li></ul></li><li><i>Mojikyo</i></li><li>SEASCAL</li><li>Stanford/ITS</li><li>Símbolo</li><li>TRONDE</li><li>Código de suspensão unificado</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Característica de controle</th><td class="navbox-list-with-group navbox-list navbox-even hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>Promissões de morse</li><li>Códigos de controle C0 e C1 <ul><li>ISO/IEC 6429</li><li>JIS X 0211</li></ul></li><li>Unicode control, formato e separador caracteres</li><li>Personagens do Whitespace</li></ul></div></td></tr><tr><th class="navbox-group" scope="row" style="width:1%">Temas relacionados</th><td class="navbox-list-with-group navbox-list navbox-odd hlist" style="width:100%;padding:0"><div style="padding:0 0.25em"><ul><li>CCSID</li><li>Codificações de caracteres em HTML</li><li>Detecção de caracteres</li><li>unificação de Han</li><li>Página de código do hardware</li><li>Código MICR</li><li>Mojibake</li><li>Codificação de comprimento variável</li></ul></div></td></tr><tr><td class="navbox-abovebelow" colspan="2"><div><span class="noviewer" typeof="mw:File"><span title="Category"><img alt="" class="mw-file-element" data-file-height="185" data-file-width="180" decoding="async" height="16" src="https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/16px-Symbol_category_class.svg.png" srcset="https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/23px-Symbol_category_class.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/31px-Symbol_category_class.svg.png 2x" width="16"/></span></span> Conjuntos de caracteres</div></td></tr></tbody></table></div></div><!--[--><!----><!--[--><!--]--><div class="more-results"> Más resultados... </div><!--]--><div class="related-video-wrapper" data-nosnippet><div class="matched-video"><span>Te puede interesar</span><iframe width="560" height="315" src="https://www.youtube.com/embed/AxKeI8vMua0" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></div></div></main><!--]--><footer id="piedepaginar" class="piedepagina"><link href="https://fonts.googleapis.com/css2?family=Lato:wght@900&display=swap" rel="stylesheet"><div class="footerContainer"><div class="headerWrapper"><header class="footerLogo"><span class="metamainlogo"><img src="data:image/webp;base64,UklGRoQDAABXRUJQVlA4WAoAAAAQAAAAPwAAPwAAQUxQSLAAAAABcFpr29q8K4TXIJmMgp5GI5XCAuQTV5iBftW/jK/viYgJwGMrqVeH888eV3Vs4WWtWIjzj4t5rrzgTeWZUI6cJ8FwJu2DB95wph1cAOr0TDxWgVIyyRzW8kw9N1PBdQzbM3m1YVsd2XZndkn3B+yR7bBhW7dsdSK4RGQtuGYmCsl0ygBlxDRSADgDT+/g3u9Zeh+P7ZFkOHU2niv5XPyamGcKXjbjdnv4ncO2TUw8BlZQOCCuAgAAEA0AnQEqQABAAD5tKpJFpCIhlwtuqEAGxKAHjeQEgi2wF2kwJ3obtJhgdmFMy4naPT0J9Bz017BKOOzJC43PG59yxl1m7mYUS9TyyL0ptMch8uybByfBk7BUfyawFwSTNLxfFzwDrOMiQ0kZy1Q7sAAA/vFNL/7z+XNfe2Gw+n/yvladk0KjNDMUvodAfZJNyM3bDviJxigd3bmV3HL/lMqPirR7L9/7M7WCmv58Jyqc5ENWBUxnUgLON5OhuBaummLKsjYU+xMRGYwCZAE0hNztb2LIT1SDybKcPR1Zfzzr0PND1D259N2JYnWJ2VzhMwkpcGgtDuRFjRTFz0TNr2pEkdZBvMaB5k/LE4ICQd1aPhsx23WeSANZZ1nGu1qPyZiAR4YbSjCoTYU+wOLEZNNSK4v9vWee05zbdCSpS+h2bwzB6163DE5ngi/I1Jpgptu3o0XMk7HDpZZALKXwJxPro+f8SeqvIeMfMeR/cEp0kmFjiye2IE1uKBzWBnQKmU7nF/Rx8dzXdoYz50pSD+bpKVR90kF6KEslioMq5MqXEb+7wkD3d3XaMKCpJ/xnD4Vb/nhECzgJQaie1f8s811Ct01cIUgcsc1/RDdoM1HlwC7OEOlIZi+dOxzv7KVlU0EokDXOoduJfrvLez62qusA29VYImd+d4adMQKlkqrl34S94mdtanzJ7IZwTYSPwl2QPT5HPcu3Q4PhSMaKTOidi5qygq9exxs/jRr7xzfj5vXLoQNTNjCU/vaE9C+8yf8Vk9yXiRRn1VtMhxVUDFH+t8+V4f2+sVWCwErfYtvq3bAYlH6m35jpL6KGEWjXQFs7p/tzkKO4TPQws6DhFft2wpsPzOXTTKa1WaCI8RUKIPvlTJbuSV2mpQp4iTUyoHbkyim8y1vYCsJ1AAA=" alt="Academia Lab logo" class="logo-footer"><a href=" https://academia-lab.com/ "> AcademiaLab </a></span></header></div><div class="infoWrapper"><div><span></span><span>YouTube: <a href="https://www.youtube.com/@academialab">@academialab</a></span><span>TikTok: <a href="https://www.tiktok.com/@academialab">@academialab</a></span><span>LinkedIn: <a href="https://www.linkedin.com/company/academialab/">@academialab</a></span><span class="non">Facebook: <a href="https://www.facebook.com/academialabf">@academialabf</a></span><span class="non">Instagram: <a href="https://www.instagram.com/academialabf/">@academialabf</a></span><span class="non">X: <a href="https://x.com/academialabf">@academialabf</a></span></div><div class="to-remove"><span><a href="#">Tema</a></span><span><a href="#">Categorías</a></span><span><a href="#">Libros</a></span></div><div><span>Site design / logo ©</span><span>2024 AcademiaLab</span><span><a href="https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es">CC BY-NC-ND</a></span><span><a href="mailto:info@academia-lab.com">info@academia-lab.com</a></span></div></div></div></footer><span></span><dialog id="adjustDlg"><div class="adjustDlgWrapper"><div class="adjustDlgItem"><div class="adjustDlgItemDesc">Tamaño del texto:</div><div class="adjustDlgItemSett"><div class="adjustDlgRadioWrapper"><div class="adjustDlgRadioOpt"><input type="radio" value="14" id="sText" name="loptions" checked><label class="adjustDlgRadioOptLabel" for="sText">Pequeño</label></div><div class="adjustDlgRadioOpt"><input type="radio" value="16" name="loptions" id="mText"><label class="adjustDlgRadioOptLabel" for="mText">Mediano</label></div><div class="adjustDlgRadioOpt"><input type="radio" value="20" name="loptions" id="bText"><label class="adjustDlgRadioOptLabel" for="bText">Grande</label></div></div></div></div></div></dialog><!--[--><ul class="custom-menu"><li data-action="copy">Copiar</li><li data-action="edit">Editar</li><li data-action="summarize">Resumir</li></ul><div class="custom-ia-panel"><div class="custom-ia-panel-wrapper"><l-tail-chase size="40" speed="1.75" color="black"></l-tail-chase></div></div><div class="editor-options"><div class="editor-options-w"><span class="icon material-symbols-outlined" data-action="editor-undo">undo</span><span class="icon material-symbols-outlined" data-action="editor-redo">redo</span><div class="divider"></div><span class="icon material-symbols-outlined" data-action="editor-bold">format_bold</span><span class="icon material-symbols-outlined" data-action="editor-italic">format_italic</span><span class="icon material-symbols-outlined" data-action="editor-underline">format_underlined</span><span class="icon material-symbols-outlined" data-action="editor-strikethrough">strikethrough_s</span><span class="icon material-symbols-outlined" data-action="editor-superscript">superscript</span><span class="icon material-symbols-outlined" data-action="editor-subscript">subscript</span><span class="icon material-symbols-outlined" data-action="editor-linkpopup">link</span><div class="divider"></div><span class="icon material-symbols-outlined" data-action="editor-save">save</span></div></div><div class="editor-link"><div class="editor-link-w"><div class="link-field" contenteditable="true"></div><div class="link-options"><span class="icon material-symbols-outlined" data-action="editor-linkpopup-cancel">cancel</span><span class="icon material-symbols-outlined" data-action="editor-linkpopup-add">check_circle</span></div></div></div><!--]--><!--]--></div><div id="teleports"></div><script type="application/json" data-nuxt-data="nuxt-app" data-ssr="true" id="__NUXT_DATA__">[["ShallowReactive",1],{"data":2,"state":19,"once":21,"_errors":22,"serverRendered":25,"path":26},["ShallowReactive",3],{"content":4,"related":15},{"status":5,"payload":7},{"code":6},200,{"id":8,"slug":9,"datePublished":10,"dateModified":10,"author":11,"status":12,"title":13,"content":14},29787,"mojibake","2024-09-09T08:05:53.662235Z","AcademiaLab Editors","","Mojibake","\u003Cdiv class=\"shortdescription nomobile noexcerpt noprint searchaux\" style=\"display:none\">Texto arquivado como resultado de codificações de caracteres incorretas\u003C/div>\u003Cfigure typeof=\"mw:File/Thumb\">\u003Ca class=\"mw-file-description\" href=\"https://en.wikipedia.org/wiki/File:Mojibakevector.png\">\u003Cimg class=\"mw-file-element\" data-file-height=\"1596\" data-file-width=\"2880\" decoding=\"async\" height=\"277\" src=\"https://upload.wikimedia.org/wikipedia/commons/thumb/1/19/Mojibakevector.png/500px-Mojibakevector.png\" srcset=\"https://upload.wikimedia.org/wikipedia/commons/thumb/1/19/Mojibakevector.png/750px-Mojibakevector.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/1/19/Mojibakevector.png/1000px-Mojibakevector.png 2x\" width=\"500\"/>\u003C/a>\u003Cfigcaption>O artigo da Wikipédia japonesa codificado UTF-8 para Mojibake exibido como se interpretado como Windows-1252\u003C/figcaption>\u003C/figure>\u003Cfigure typeof=\"mw:File/Thumb\">\u003Ca class=\"mw-file-description\" href=\"https://en.wikipedia.org/wiki/File:Mojibakevector2.png\">\u003Cimg class=\"mw-file-element\" data-file-height=\"906\" data-file-width=\"1834\" decoding=\"async\" height=\"247\" src=\"https://upload.wikimedia.org/wikipedia/commons/thumb/e/ee/Mojibakevector2.png/500px-Mojibakevector2.png\" srcset=\"https://upload.wikimedia.org/wikipedia/commons/thumb/e/ee/Mojibakevector2.png/750px-Mojibakevector2.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/e/ee/Mojibakevector2.png/1000px-Mojibakevector2.png 2x\" width=\"500\"/>\u003C/a>\u003Cfigcaption>O artigo da Wikipédia russa codificada UTF-8 sobre a Igreja Slavonic exibido como se interpretado como KOI8-R\u003C/figcaption>\u003C/figure>\u003Cp> \u003Cb> mojibake \u003C/b> (japonês: \u003Cspan lang = \"ja\"> 文字 化け \u003C/span>; \u003Cspan class = \"ipa-label ipa-label-small\"> iPA: \u003C/span> \u003Cspan class = \"ipa nowrap\" Lang = \"Ja-Latn-Fonipa\"> [Mod͡ʑibake] \u003C/span>, " Transformação do caractere ") é o texto ilegal ou sem sentido que é o resultado do texto sendo decodificado usando uma codificação de caracteres não intencionais. O resultado é uma substituição sistemática de símbolos por outros completamente não relacionados, geralmente de um sistema de escrita diferente.\n\u003C/p>\u003Cp> Esta tela pode incluir o caractere de substituição genérica (" � 34;) em locais onde a representação binária é considerada inválida. Uma substituição também pode envolver vários símbolos consecutivos, como visto em uma codificação, quando o mesmo código binário constitui um símbolo na outra codificação. Isso ocorre devido à codificação de comprimento constante diferente (como nas codificações asiáticas de 16 bits versus codificações européias de 8 bits) ou o uso de codificações de comprimento variável (principalmente UTF-8 e UTF-16).\n\u003C/p>\u003Cp> A falha na renderização dos glifos devido a fontes ausentes ou a falta de glifos em uma fonte é um problema diferente que não deve ser confundido com Mojibake. Os sintomas dessa renderização falhada incluem blocos com o ponto de código exibido em hexadecimal ou usando o caractere de substituição genérica. É importante ressaltar que essas substituições são \u003Ci> válidas \u003C/i> e são o resultado do tratamento de erros correto pelo software.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"Causes\">Causas\u003C/h2>\u003C/div>\u003Cp> Para reproduzir corretamente o texto original que foi codificado, a correspondência entre os dados codificados e a noção de codificação deve ser preservada (ou seja, os padrões de codificação de origem e destino devem ser os mesmos). Como o Mojibake é o exemplo de não conformidade entre eles, ele pode ser alcançado manipulando os dados em si ou apenas relacionando-os.\n\u003C/p>\u003Cp> Mojibake é frequentemente visto com dados de texto que foram marcados com uma codificação errada; Pode nem ser marcado, mas movido entre computadores com diferentes codificações padrão. Uma importante fonte de problema são os protocolos de comunicação que dependem de configurações em cada computador, em vez de enviar ou armazenar metadados juntamente com os dados.\n\u003C/p>\u003Cp> As diferentes configurações padrão entre os computadores são em parte devido a diferentes implantações do Unicode entre as famílias de sistemas operacionais e em parte as codificações do Legacy ' Especializações para diferentes sistemas de escrita de idiomas humanos. Enquanto as distribuições do Linux foram alteradas principalmente para o UTF-8 em 2004, o Microsoft Windows geralmente usa o UTF-16 e, às vezes, usa páginas de código de 8 bits para arquivos de texto em diferentes linguagens.\n\u003C/p>\u003Cp> Para alguns sistemas de escrita, como japoneses, várias codificações foram historicamente empregadas, fazendo com que os usuários vejam Mojibake com relativa frequência. Como exemplo, a palavra \u003Ci> mojibake \u003C/i> (" 文字 化け 化け 化け 化け 化け#34;) armazenada como euc-jp pode ser exibida incorretamente como " ハクサ � ス 、 ア ア ア ア ア " , " ハクサ嵂ス ア ア " (MS-932), ou " ハクサ郾ス ア ア " se interpretado como shift-jis, ou como " ê¸ »Ú² ½ ± " No software que assume que o texto esteja nas codificações Windows-1252 ou ISO 8859-1, geralmente rotuladas \u003Ci> ocidental \u003C/i> ou \u003Ci> europeu ocidental \u003C/i>. Isso é ainda exacerbado se outros locais estiverem envolvidos: o mesmo texto armazenado que o UTF-8 aparece como " 譁 � 蟄怜喧縺 � " se interpretado como shift-jis, como " æ-‡ Å-Åœ-–#34; se interpretado como ocidental, ou (por exemplo) como " 鏂囧 瓧 栥亼 栥亼 栥亼 " se interpretado como estando em um local de GBK (China continental).\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center; margin: auto;\">\u003Ccaption>Exemplo de Mojibake\n\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Texto original\n\u003C/th>\u003Ctd colspan=\"6\">文\n\u003C/td>\u003Ctd colspan=\"6\">字\n\u003C/td>\u003Ctd colspan=\"6\">?\n\u003C/td>\u003Ctd colspan=\"6\">け\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes brutos de codificação EUC-JP\n\u003C/th>\u003Ctd colspan=\"3\">CA\u003C/td>\u003Ctd colspan=\"3\">B8\u003C/td>\u003Ctd colspan=\"3\">BB\u003C/td>\u003Ctd colspan=\"3\">FA\u003C/td>\u003Ctd colspan=\"3\">B2\u003C/td>\u003Ctd colspan=\"3\">BD\u003C/td>\u003Ctd colspan=\"3\">A4\u003C/td>\u003Ctd colspan=\"3\">B1\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>EUC-JP bytes interpretado como Shift-JIS\n\u003C/th>\u003Ctd colspan=\"3\">?\u003C/td>\u003Ctd colspan=\"3\">?\u003C/td>\u003Ctd colspan=\"3\">- Sim.\u003C/td>\u003Ctd colspan=\"6\">郾\u003C/td>\u003Ctd colspan=\"3\">PRESIDÊNCIA\u003C/td>\u003Ctd colspan=\"3\">、\u003C/td>\u003Ctd colspan=\"3\">ア\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes EUC-JP interpretados como GBK\n\u003C/th>\u003Ctd colspan=\"6\">矢\u003C/td>\u003Ctd colspan=\"6\">Efeitos\u003C/td>\u003Ctd colspan=\"6\">步\u003C/td>\u003Ctd colspan=\"6\">け\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes EUC-JP interpretados como Windows-1252\n\u003C/th>\u003Ctd colspan=\"3\">?\u003C/td>\u003Ctd colspan=\"3\">?\u003C/td>\u003Ctd colspan=\"3\">»\u003C/td>\u003Ctd colspan=\"3\">?\u003C/td>\u003Ctd colspan=\"3\">2\u003C/td>\u003Ctd colspan=\"3\">1⁄2\u003C/td>\u003Ctd colspan=\"3\">¤\u003C/td>\u003Ctd colspan=\"3\">±\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes brutos de codificação UTF-8\n\u003C/th>\u003Ctd colspan=\"2\">E6\u003C/td>\u003Ctd colspan=\"2\">96\u003C/td>\u003Ctd colspan=\"2\">87\u003C/td>\u003Ctd colspan=\"2\">E5\u003C/td>\u003Ctd colspan=\"2\">ANÚNCIO\u003C/td>\u003Ctd colspan=\"2\">97\u003C/td>\u003Ctd colspan=\"2\">E5\u003C/td>\u003Ctd colspan=\"2\">8C\u003C/td>\u003Ctd colspan=\"2\">96\u003C/td>\u003Ctd colspan=\"2\">E3\u003C/td>\u003Ctd colspan=\"2\">81\u003C/td>\u003Ctd colspan=\"2\">91\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes UTF-8 interpretados como Shift-JIS\n\u003C/th>\u003Ctd colspan=\"4\">譁\u003C/td>\u003Ctd colspan=\"2\">\u003C/td>\u003Ctd colspan=\"4\">蟄\u003C/td>\u003Ctd colspan=\"4\">怜\u003C/td>\u003Ctd colspan=\"4\">喧\u003C/td>\u003Ctd colspan=\"4\">縺\u003C/td>\u003Ctd colspan=\"2\">\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes UTF-8 interpretados como GBK\n\u003C/th>\u003Ctd colspan=\"4\">鏂\u003C/td>\u003Ctd colspan=\"4\">囧\u003C/td>\u003Ctd colspan=\"4\">瓧\u003C/td>\u003Ctd colspan=\"4\">鍖\u003C/td>\u003Ctd colspan=\"4\">栥\u003C/td>\u003Ctd colspan=\"4\">亼\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>bytes UTF-8 interpretados como Windows-1252\n\u003C/th>\u003Ctd colspan=\"2\">æ\u003C/td>\u003Ctd colspan=\"2\">–\u003C/td>\u003Ctd colspan=\"2\">‡\u003C/td>\u003Ctd colspan=\"2\">å\u003C/td>\u003Ctd colspan=\"2\" style=\"font-size:75%;padding:0pt\" title=\"U+00AD: SOFT HYPHEN (alias SHY)\">\u003Cspan style=\"display:inline-block; border:1px dashed black;\">SHIELD\u003C/span>\u003C/td>\u003Ctd colspan=\"2\">—\u003C/td>\u003Ctd colspan=\"2\">å\u003C/td>\u003Ctd colspan=\"2\">?\u003C/td>\u003Ctd colspan=\"2\">–\u003C/td>\u003Ctd colspan=\"2\">?\u003C/td>\u003Ctd colspan=\"2\" style=\"font-size:75%;padding:0pt\" title=\"U+0081: Control (alias HIGH OCTET PRESET) (alias HOP)\">\u003Cspan style=\"display:inline-block; border:1px dashed black;\">HOP\u003C/span>\u003C/td>\u003Ctd colspan=\"2\">'\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Underspecification\">Subespecífica\u003C/h3>\u003C/div>\u003Cp> Se a codificação não for especificada, cabe ao software decidir por outros meios. Dependendo do tipo de software, a solução típica é a configuração ou as heurísticas de detecção de charset. Ambos são propensos a erradamente.\n\u003C/p>\u003Cp> A codificação dos arquivos de texto é afetada pela configuração de localidade, que depende da linguagem do usuário, marca de sistema operacional e muitas outras condições. Portanto, a codificação assumida está sistematicamente errada para arquivos provenientes de um computador com uma configuração diferente, ou mesmo de um software localizado diferente no mesmo sistema. Para o Unicode, uma solução é usar uma marca de pedidos de bytes, mas para o código -fonte e outro texto legível por máquina, muitos analisadores não toleram isso. Outro está armazenando a codificação como metadados no sistema de arquivos. Os sistemas de arquivos que suportam atributos de arquivo estendidos podem armazenar isso como \u003Ccode> user.charset \u003C/code>. Isso também requer suporte em software que deseja tirar proveito dele, mas não perturba outro software.\n\u003C/p>\u003Cp> Embora algumas codificações sejam fáceis de detectar, como o UTF-8, há muitos que são difíceis de distinguir (consulte a detecção de charset). Um navegador da Web pode não ser capaz de distinguir uma página codificada no EUC-JP e outra em Shift-Jis se a codificação não for atribuída explicitamente usando cabeçalhos HTTP enviados junto com os documentos ou usando os meta tags do documento HTML que tags que tam são usados para substituir os cabeçalhos HTTP ausentes se o servidor não puder ser configurado para enviar os cabeçalhos HTTP adequados; Veja as codificações do personagem em HTML.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Mis-specification\">Especificação errada\u003C/h3>\u003C/div>\u003Cp> Mojibake também ocorre quando a codificação é especificada incorretamente. Isso geralmente acontece entre as codificações semelhantes. Por exemplo, o Eudora Email Client para Windows era conhecido por enviar e-mails rotulados como ISO 8859-1 que, na realidade, Windows-1252. O Windows-1252 contém caracteres imprimíveis extras no intervalo C1 (os mais frequentemente vistos sendo aspas curvas e traços extras), que não foram exibidos corretamente no software em conformidade com o padrão ISO; Isso afetou especialmente o software em execução em outros sistemas operacionais, como o UNIX.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"User_oversight\">Supervisão do usuário\u003C/h4>\u003C/div>\u003Cp> das codificações ainda em uso comum, muitas se originaram de tomar ASCII e anexá -lo ao topo; Como resultado, essas codificações são parcialmente compatíveis entre si. Exemplos disso incluem o Windows-1252 e a ISO 8859-1. Assim, as pessoas podem confundir o conjunto de codificação expandido que eles estão usando com ASCII simples.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Overspecification\">Sobreespecífica\u003C/h3>\u003C/div>\u003Cp> Quando existem camadas de protocolos, cada uma tentando especificar a codificação com base em informações diferentes, as menos informações podem ser enganosas para o destinatário.\nPor exemplo, considere um servidor da web que serve um arquivo HTML estático sobre HTTP. O conjunto de personagens pode ser comunicado ao cliente de várias maneiras:\n\u003C/p>\u003Cul>\u003Cli>no cabeçalho HTTP. Essas informações podem ser baseadas na configuração do servidor (por exemplo, ao servir um arquivo fora do disco) ou controladas pelo aplicativo em execução no servidor (para sites dinâmicos).\u003C/li>\u003Cli>no arquivo, como uma meta tag HTML (\u003Ccode>http-equiv\u003C/code> ou \u003Ccode>charset\u003C/code>) ou o \u003Ccode>encoding\u003C/code> atributo de uma declaração XML. Esta é a codificação que o autor queria salvar o arquivo em particular.\u003C/li>\u003Cli>no arquivo, como uma marca de ordem byte. Esta é a codificação que o editor do autor realmente salvou-o. A menos que uma conversão acidental de codificação tenha acontecido (abrindo-a em uma codificação e salvando-a em outra), isso será correto. É, no entanto, apenas disponível em codificações Unicode, como UTF-8 ou UTF-16.\u003C/li>\u003C/ul>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Lack_of_hardware_or_software_support\">Falta de suporte de hardware ou software\u003C/h3>\u003C/div>\u003Cp> O hardware muito mais antigo é normalmente projetado para suportar apenas um conjunto de caracteres e o conjunto de caracteres normalmente não pode ser alterado. A tabela de caracteres contida no firmware de exibição estará localizada para ter caracteres para o país em que o dispositivo deve ser vendido e, normalmente, a tabela difere de país para país. Como tal, esses sistemas poderão exibir mojibake ao carregar o texto gerado em um sistema de um país diferente. Da mesma forma, muitos sistemas operacionais iniciais não suportam vários formatos de codificação e, portanto, acabarão exibindo Mojibake se forem feitos para exibir texto não padrão-versões de Microsoft Windows e Palm OS, por exemplo, estão localizadas por país e apenas serão Padrões de codificação de suporte relevantes para o país em que a versão localizada será vendida e exibirá Mojibake se um arquivo que contém um texto em um formato de codificação diferente da versão que o sistema operacional for projetado para suportar for aberto.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"Resolutions\">Resolução\u003C/h2>\u003C/div>\u003Cp> As aplicações usando UTF-8 como uma codificação padrão podem atingir um maior grau de interoperabilidade devido ao seu uso generalizado e compatibilidade com versões anteriores com US-ASCII. O UTF-8 também tem a capacidade de ser reconhecido diretamente por um algoritmo simples, para que o software bem escrito possa evitar misturar o UTF-8 com outras codificações.\n\u003C/p>\u003Cp> A dificuldade de resolver uma instância de mojibake varia dependendo da aplicação em que ocorre e das causas dela. Dois dos aplicativos mais comuns nos quais o Mojibake pode ocorrer são navegadores da Web e processadores de texto. Os navegadores modernos e os processadores de texto geralmente suportam uma ampla gama de codificações de caráter. Os navegadores geralmente permitem que um usuário altere o mecanismo de renderização da configuração de codificação em tempo real, enquanto os processadores de texto permitem ao usuário selecionar a codificação apropriada ao abrir um arquivo. Pode levar alguma tentativa e erro para os usuários encontrarem a codificação correta.\n\u003C/p>\u003Cp> O problema fica mais complicado quando ocorre em um aplicativo que normalmente não suporta uma ampla gama de codificação de caracteres, como em um jogo de computador não unicode. Nesse caso, o usuário deve alterar as configurações de codificação do sistema operacional para corresponder às do jogo. No entanto, a alteração das configurações de codificação em todo o sistema também pode causar mojibake em aplicações pré-existentes. No Windows XP ou posterior, um usuário também tem a opção de usar o Microsoft Applocale, um aplicativo que permite a alteração das configurações de localidade por aplicativo. Mesmo assim, a alteração das configurações de codificação do sistema operacional não é possível em sistemas operacionais anteriores, como o Windows 98; Para resolver esse problema nos sistemas operacionais anteriores, um usuário teria que usar aplicativos de renderização de fontes de terceiros.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"Problems_in_different_writing_systems\">Problemas em sistemas de escrita diferentes\u003C/h2>\u003C/div>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"English\">Inglês\u003C/h3>\u003C/div>\u003Cp> mojibake nos textos em inglês geralmente ocorre na pontuação, como os traços ( -), en traghes ( -) e citações encaracoladas (\",\", ','), mas raramente no texto do personagem, uma vez que a maioria das codificações concorda com ASCII sobre a codificação do alfabeto inglês. Por exemplo, o sinal de libra \u003CCode> £ \u003C/code> aparecerá como \u003Ccode> £ \u003C/code> se for codificado pelo remetente como UTF-8, mas interpretado pelo destinatário como uma das codificações da Europa Ocidental ( CP1252 ou ISO 8859-1). Se iterado usando o CP1252, isso pode levar a \u003C/code> £ \u003C/code>, \u003Ccode> ã € € € ‚£ \u003C/code>, \u003Ccode> ã ã ¢ € e assim por diante.\n\u003C/p>\u003Cp> Da mesma forma, a cotação única certa ('), quando codificada no UTF-8 e decodificada usando o Windows-1252, torna-se \u003Ccode> â € \u003C/code>, \u003Ccode> ¢ \u003C/code>, \u003Ccode> à ¢\n\u003C/p>\u003Cp> Nas épocas mais antigas, alguns computadores tinham codificações específicas de fornecedores que causaram incompatibilidade também para o texto em inglês. Os computadores de 8 bits da marca Commodore usaram a codificação PetSCII, particularmente notável para inverter a parte superior e inferior em comparação com o ASCII padrão. As impressoras PetScii funcionaram bem em outros computadores da época, mas inverteu o caso de todas as cartas. Os mainframes IBM usam a codificação EBCDIC que não corresponde a ASCII.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Other_Western_European_languages\">Outras línguas da Europa Ocidental\u003C/h3>\u003C/div>\u003Cp> Os alfabetos das línguas norte -germânicas, catalã, romeno, finlandês, francês, alemão, italiano, português e espanhol são todas extensões do alfabeto latino. Os caracteres adicionais são tipicamente os que são corrompidos, tornando os textos apenas levemente ilegíveis com o Mojibake:\n\u003C/p>\u003Cul>\u003Cli>å, ä, ö em finlandês e sueco (š e ž estão presentes em alguns empréstimos finlandeses, é marginalmente em sueco, principalmente em palavras de empréstimo)\u003C/li>\u003Cli>à, ç, è, é, ï, í, ò, ó, ú, ü em catalão\u003C/li>\u003Cli>æ, ø, å em norueguês e dinamarquês, bem como acentos agudos opcionais em é etc para a desambiguação\u003C/li>\u003Cli>, é, ó, ij, è, ë, ï em holandês\u003C/li>\u003Cli>ä, ö, ü, e ß em alemão\u003C/li>\u003Cli>, ð, í, ó, ú, ý, æ, ø em Faroese\u003C/li>\u003Cli>Na Islândia\u003C/li>\u003Cli>a, ç, è, é, ë, ê, ï, î, ô, ù, û, ü, ÿ, ÿ, æ, œ in French\u003C/li>\u003Cli>a, è, é, ì, ò, ù em italiano\u003C/li>\u003Cli>em espanhol\u003C/li>\u003Cli>à, á, â, ã, ç, é, ê, í, ó, ô, õ, ú in Portuguese (ü no longer used)\u003C/li>\u003Cli>ú em irlandês\u003C/li>\u003Cli>à, è, ì, ò, ù em gaélico escocês\u003C/li>\u003Cli>ă, î, ș, ț in Romanian\u003C/li>\u003Cli>£ em Inglês Britânico (æ e œ raramente são usados)\u003C/li>\u003C/ul>\u003Cp> ... e suas contrapartes maiúsculas, se aplicável.\n\u003C/p>\u003Cp> Estes são idiomas para os quais o conjunto de caracteres ISO 8859-1 (também conhecido como \u003Ci> Latin 1 ou \u003Ci> Western \u003C/i>) está em uso. No entanto, a ISO 8859-1 foi obsoleta por dois padrões concorrentes, o Windows-1252 compatível com versões anteriores e a ISO 8859-15 ligeiramente alterada. Ambos adicionam o sinal do euro e os franceses œ, mas, caso contrário, qualquer confusão desses três conjuntos de personagens não cria mojibake nesses idiomas. Além disso, é sempre seguro interpretar a ISO 8859-1 como Windows-1252 e bastante segura interpretá-lo como ISO 8859-15, em particular em relação ao sinal do euro, que substitui o sinal de moeda raramente usado (¤). No entanto, com o advento do UTF-8, o Mojibake se tornou mais comum em certos cenários, p. Troca de arquivos de texto entre os computadores do UNIX e do Windows, devido à incompatibilidade do UTF-8 com Latin-1 e Windows-1252. Mas o UTF-8 tem a capacidade de ser reconhecido diretamente por um algoritmo simples, para que o software bem escrito deve evitar misturar o UTF-8 com outras codificações, portanto, isso era mais comum quando muitos tinham software não suportando UTF-8. A maioria desses idiomas foi suportada pelo MS-DOS Padrão CP437 e outras codificações padrão da máquina, exceto ASCII, portanto, os problemas ao comprar uma versão do sistema operacional eram menos comuns. Windows e MS-DOS não são compatíveis, no entanto.\n\u003C/p>\u003Cp> Em vogais suecas, norueguesas, dinamarquesas e alemãs, raramente são repetidas, e geralmente é óbvio quando um personagem é corrompido, por exemplo A segunda letra na palavra sueca \u003Ci> \u003Cspan title = \"texto em língua sueca\"> \u003Ci lang = \"sv\"> kärlek \u003C/i> \u003C/span> \u003C/i> (" amor " ;) quando é codificado no UTF-8, mas decodificado no oeste, produzindo \"kã⁠ärlek\" ou \u003Ci> für \u003C/i> em alemão, que se torna \"für " . Dessa forma, mesmo que o leitor precise adivinhar qual é a carta original, quase todos os textos permanecem legíveis. Finlandês, por outro lado, freqüentemente usa vogais repetidas em palavras como \u003Ci> \u003Cspan title = \"texto finlandês\"> \u003Ci lang = \"fi\"> hääyö \u003C/i> \u003C/span> \u003C/i> ( " noite de casamento ") que pode dificultar a leitura do texto corrompido (por exemplo, \u003Ci> \u003Cspan title = \"texto finlandês\"> \u003Ci lang = \"fi\"> hääyö \u003C/i> \u003C/ Span> \u003C/i> aparece como como " O islandês tem dez personagens possivelmente confusos, e Faroese tem oito, tornando muitas palavras quase completamente ininteligíveis quando corrompidas (por exemplo, islandês \u003Ci> \u003Cspan title = \"texto da língua islandesa\"> \u003Ci lang = \"is\"> Þjóðlöð \u003C/i> \u003C/span> \u003C/i>, " Hospitalidade destacada ", aparece como como "\n\u003C/p>\u003Cp> em alemão, \u003Ci> \u003Cspan title = \"texto em alemão\"> \u003Ci lang = \"de\"> Buchstabensalat \u003C/i> \u003C/span> \u003C/i> (" Salada de carta " ;) é um termo comum para esse fenômeno, em espanhol, \u003Ci> \u003Cspan title = \"texto em espanhol\"> \u003Ci lang = \"es\"> deformación \u003C/i> \u003C/span> \u003C/i> (literalmente " deformação ") é usada e, em português, \u003Ci> \u003Cspan title = \"texto português-language\"> \u003Ci lang = \"pt\"> DesformatAção \u003C/i> \u003C/span> \u003C/i > (literalmente " Deformating ") é usado.\n\u003C/p>\u003Cp> Alguns usuários translitram sua escrita ao usar um computador, omitindo os diacríticos problemáticos ou usando substituições de diGraph (Å → Aa, ä/Æ æ → Ae, Ö/Ø → OE, ü → UE etc.). Assim, um autor pode escrever " Ueber " Em vez de \"#34;\"#34;, que é uma prática padrão em alemão quando os umlauts não estão disponíveis. A última prática parece ser melhor tolerada na esfera da língua alemã do que nos países nórdicos. Por exemplo, em norueguês, os digrafos estão associados a dinamarquês arcaicos e podem ser usados brincando. No entanto, os dígrafos são úteis na comunicação com outras partes do mundo. Como exemplo, o jogador de futebol norueguês Ole Gunnar Solskjær teve seu sobrenome escrito " Solskjaer " em seu uniforme quando ele jogou pelo Manchester United.\n\u003C/p>\u003Cp> Um artefato de UTF-8 interpretado mal como ISO 8859-1, " " Sendo renderizado como \"Ring Meg n ¥ ", foi visto em 2014 em um golpe de SMS direcionado à Noruega.\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ccaption>\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Exemplo sueco\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\u003Cbr/>\u003Cspan style=\"color: red;\">(Os ratos em vermelho estão incorretos.)\u003C/span>\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"6\">Smörgås\u003Cbr/>(suíche aberto)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>MS-DOS 437\u003C/td>\u003Ctd rowspan=\"2\">ISO 8859-1\u003C/td>\u003Ctd>Sm\u003Cspan style=\"color: red;\">?\u003C/span>rg\u003Cspan style=\"color: red;\">†\u003C/span>S\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"3\">UTF-8\u003C/td>\u003Ctd>Sm\u003Cspan style=\"color: red;\">#\u003C/span>rg\u003Cspan style=\"color: red;\">?\u003C/span>S\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>IBM/CP037 (EBCDIC)\u003C/td>\u003Ctd>\u003Cspan style=\"color: red;\">ë\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"2\">Mac Roman.\u003C/td>\u003Ctd>Sm\u003Cspan style=\"color: red;\">√∂\u003C/span>rg\u003Cspan style=\"color: red;\">√•\u003C/span>S\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>ISO 8859-1\u003C/td>\u003Ctd>Sm\u003Cspan style=\"color: red;\">,\u003C/span>rg\u003Cspan style=\"color: red;\">Â\u003C/span>S\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cp> O mesmo problema ocorre também em romeno, veja estes exemplos:\n\u003C/p>\u003Cp> \u003Cbr/>\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ccaption>\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Exemplo romeno\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\u003Cbr/>\u003Cspan style=\"color: red;\">(Os ratos em vermelho estão incorretos.)\u003C/span>\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"8\">São Paulo\u003Cbr/>(más)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"7\">UTF-8\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>ASCII\u003C/td>\u003Ctd>Cenu\u003Cspan style=\"color: red;\">È\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>ISO 8859-2\u003C/td>\u003Ctd>Cenu\u003Cspan style=\"color: red;\">Ç\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>OEM 737\u003C/td>\u003Ctd>Cenu\u003Cspan style=\"color: red;\">ββ Δ\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Shift-JIS\u003C/td>\u003Ctd>Cenu\u003Cspan style=\"color: red;\">ネ卞 \u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>TIS-620\u003C/td>\u003Ctd>Cenu\u003Cspan style=\"color: red;\">O quê?\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>IBM/CP037 (EBCDIC)\u003C/td>\u003Ctd>\u003Cspan style=\"color: red;\"> \u003C/span>\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Central_and_Eastern_European\">Europa Central e Oriental\u003C/h3>\u003C/div>Os usuários de idiomas da Europa Central e Oriental também podem ser afetados. Como a maioria dos computadores não estava conectada a nenhuma rede durante o final da década de 1980, havia diferentes codificações de caracteres para cada idioma com caracteres diacríticos (ver ISO/IEC 8859 e KOI-8), geralmente também variando pelo sistema operacional.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Hungarian\">Húngaro\u003C/h4>\u003C/div>\u003Cp> Em húngaro, o fenômeno é referido como \u003Ci> BETűSZEMÉT \u003C/I>, Significado " Letra Garbage ". O húngaro tem sido particularmente suscetível, pois contém as letras acentuadas Á, é, Í, Ó, Ú, Ö, ü (todas presentes no conjunto de caracteres Latin-1), além dos dois caracteres ő e ű que não estão em latim-1-1 . Esses dois caracteres podem ser codificados corretamente no Latin-2, Windows-1250 e Unicode. No entanto, antes que o Unicode se tornasse comum em clientes de e-mail, os e-mails contendo texto húngaro geralmente tinham as cartas ő e ű corrompidas, às vezes ao ponto de irreconhecibilidade. É comum responder a um e-mail corrompido com a frase sem sentido " Árvíztűrő tükörfúrógép " (Literalmente " Máquina de perfuração espelhada resistente a inundações "), que contém todos os caracteres acentuados usados em húngaro.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading5\">\u003Ch5 id=\"Examples\">Exemplos\u003C/h5>\u003C/div>\u003Ctable class=\"wikitable\" style=\"text-align: center;\" width=\"90%\">\u003Ctbody>\u003Ctr>\u003Cth>Exemplo húngaro\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth width=\"250px\">Resultado\u003C/th>\u003Cth>Ocorrência\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"13\">ÁRVÍZTRRP TÜKÖRFÚRÓGÉP\u003Cbr/>Anúncio grátis para sua empresa\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>UTF-8 Quoted-printable\u003C/th>\u003Cth rowspan=\"2\">7-bit ASCII\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">C3=81\u003C/span>RV\u003Cspan style=\"color: red;\">C3 = 8D\u003C/span>ZT\u003Cspan style=\"color: red;\">C5 = B0\u003C/span>R\u003Cspan style=\"color: red;\">C5 = 90\u003C/span> T\u003Cspan style=\"color: red;\">C3 = 9C\u003C/span>KK\u003Cspan style=\"color: red;\">C3 = 96\u003C/span>RF\u003Cspan style=\"color: red;\">C3 = 9A\u003C/span>R\u003Cspan style=\"color: red;\">C3-93\u003C/span>G\u003Cspan style=\"color: red;\">C3 = 89\u003C/span>P \u003Cspan style=\"color: red;\">C3 = A1\u003C/span>rv\u003Cspan style=\"color: red;\">- C3.\u003C/span>O quê?\u003Cspan style=\"color: red;\">C5 = B1\u003C/span>R\u003Cspan style=\"color: red;\">C5 = 91\u003C/span> )\u003Cspan style=\"color: red;\">- C3 - C3\u003C/span>k\u003Cspan style=\"color: red;\">C3 = B6\u003C/span>R.\u003Cspan style=\"color: red;\">C3 = BA\u003C/span>R\u003Cspan style=\"color: red;\">C3 = B3\u003C/span>g\u003Cspan style=\"color: red;\">C3 = A9\u003C/span>p\n\u003C/td>\u003Ctd rowspan=\"2\">Principalmente causado por servidores de correio incorretamente configurados, mas pode ocorrer em mensagens SMS em alguns telefones celulares também.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>ISO 8859-2 Quoted-printable\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">= C1\u003C/span>RV\u003Cspan style=\"color: red;\">= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =\u003C/span>ZT\u003Cspan style=\"color: red;\">- BID\u003C/span>R\u003Cspan style=\"color: red;\">= D5\u003C/span> T\u003Cspan style=\"color: red;\">= DC\u003C/span>KK\u003Cspan style=\"color: red;\">= D6\u003C/span>RF\u003Cspan style=\"color: red;\">- Não.\u003C/span>R\u003Cspan style=\"color: red;\">= D3\u003C/span>G\u003Cspan style=\"color: red;\">= C9\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">-E1\u003C/span>rv\u003Cspan style=\"color: red;\">=\u003C/span>O quê?\u003Cspan style=\"color: red;\">= FB\u003C/span>R\u003Cspan style=\"color: red;\">= F5\u003C/span> )\u003Cspan style=\"color: red;\">= FF\u003C/span>k\u003Cspan style=\"color: red;\">= F6\u003C/span>R.\u003Cspan style=\"color: red;\">= FA\u003C/span>R\u003Cspan style=\"color: red;\">= F3\u003C/span>g\u003Cspan style=\"color: red;\">= E9\u003C/span>p\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>CWI-2\u003C/th>\u003Cth rowspan=\"2\">CP 437\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">Å\u003C/span>RV\u003Cspan style=\"color: red;\">?\u003C/span>ZT\u003Cspan style=\"color: red;\">PRESIDÊNCIA\u003C/span>R\u003Cspan style=\"color: red;\">o\u003C/span> TÜKÖRF\u003Cspan style=\"color: red;\">ù\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span>GÉP\u003Cbr/>O que é isso?\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> O que fazer?\n\u003C/td>\u003Ctd>A codificação CWI-2 foi projetada para que o texto húngaro permaneça bastante legível, mesmo que o dispositivo na extremidade receptora use uma das codificações padrão (CP 437 ou CP 850). Esta codificação foi usada muito fortemente entre o início da década de 1980 e o início da década de 1990, mas hoje em dia é completamente depreciada.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"4\">CP 852\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">╡\u003C/span>RV\u003Cspan style=\"color: red;\">╓\u003C/span>ZT\u003Cspan style=\"color: red;\">δ\u003C/span>R\u003Cspan style=\"color: red;\">è\u003C/span> TÜKÖRF\u003Cspan style=\"color: red;\">Θ\u003C/span>R\u003Cspan style=\"color: red;\">α\u003C/span>GÉP\u003Cbr/>O que é isso?\u003Cspan style=\"color: red;\">√\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> O que fazer?\n\u003C/td>\u003Ctd rowspan=\"2\">Isso foi muito comum nos dias do DOS, pois o texto foi muitas vezes codificado usando a página de código 852 (\"European Central\"), mas o software no fim receptor muitas vezes não apoiou o CP 852 e, em vez disso, tentou exibir texto usando CP 437 ou CP 850. As letras minúsculas são principalmente corretas, exceto para ű e ő. Ü/ü e Ö/ö estão corretas porque CP 437 e CP 850 foram feitas compatíveis com o alemão. Embora isso seja raro hoje em dia, ainda pode ser visto em locais como em prescrições e cheques impressos.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>CP 850\n\u003C/th>\u003Ctd>ÁRVÍZT\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">è\u003C/span> TÜKÖRFÚRÓGÉPRIO\u003Cbr/>O que é isso?\u003Cspan style=\"color: red;\">1\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> O que fazer?\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1250\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">μ\u003C/span>RV\u003Cspan style=\"color: red;\">Ö\u003C/span>ZT\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">S\u003C/span> T\u003Cspan style=\"color: red;\">?\u003C/span>KK\u003Cspan style=\"color: red;\">TM\u003C/span>RF\u003Cspan style=\"color: red;\">É um problema.\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span>G\u003Cspan style=\"color: red;\">?\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\"> \u003C/span>rv\u003Cspan style=\"color: red;\">:\u003C/span>Gerenciamento de contas\u003Cspan style=\"color: red;\">‹\u003C/span> )\u003Cspan style=\"color: red;\">?\u003C/span>k\u003Cspan style=\"color: red;\">\"\u003C/span>R.\u003Cspan style=\"color: red;\">Ł\u003C/span>R\u003Cspan style=\"color: red;\">̆\u003C/span>g\u003Cspan style=\"color: red;\">?\u003C/span>p\n\u003C/td>\u003Ctd>Ambas as codificações são da Europa Central, mas o texto é codificado com a codificação DOS e decodificado com a codificação do Windows. O uso do ű está correto.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"2\">Mac Roman.\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">μ\u003C/span>RV\u003Cspan style=\"color: red;\">÷\u003C/span>ZT\u003Cspan style=\"color: red;\">Ç\u003C/span>R\u003Cspan style=\"color: red;\"> \u003C/span> T\u003Cspan style=\"color: red;\">- Sim.\u003C/span>KK\u003Cspan style=\"color: red;\">?\u003C/span>RF\u003Cspan style=\"color: red;\">È\u003C/span>R\u003Cspan style=\"color: red;\">‡\u003C/span>G\u003Cspan style=\"color: red;\">?\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">†\u003C/span>rv\u003Cspan style=\"color: red;\">°\u003C/span>O quê?\u003Cspan style=\"color: red;\">̊\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> )\u003Cspan style=\"color: red;\">Å\u003C/span>k\u003Cspan style=\"color: red;\">?\u003C/span>R.\u003Cspan style=\"color: red;\">- Não.\u003C/span>R\u003Cspan style=\"color: red;\">*\u003C/span>g\u003Cspan style=\"color: red;\">Ç\u003C/span>p\n\u003C/td>\u003Ctd rowspan=\"2\">Também comum nos dias do DOS, isso pode ser visto quando os computadores da Apple tentaram exibir o texto húngaro enviado usando máquinas DOS ou Windows, pois eles muitas vezes padrão para a própria codificação da Apple.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"3\">Windows-1250\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">I\u003C/span>RV\u003Cspan style=\"color: red;\">?\u003C/span>ZT\u003Cspan style=\"color: red;\">€€\u003C/span>R\u003Cspan style=\"color: red;\">’\u003C/span> T\u003Cspan style=\"color: red;\">‹\u003C/span>KK\u003Cspan style=\"color: red;\">÷\u003C/span>RF\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">”\u003C/span>G\u003Cspan style=\"color: red;\">...\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">·\u003C/span>rv\u003Cspan style=\"color: red;\">?\u003C/span>O quê?\u003Cspan style=\"color: red;\">̊\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> )\u003Cspan style=\"color: red;\">?\u003C/span>k\u003Cspan style=\"color: red;\">,\u003C/span>R.\u003Cspan style=\"color: red;\">;\u003C/span>R\u003Cspan style=\"color: red;\">- Sim.\u003C/span>g\u003Cspan style=\"color: red;\">È\u003C/span>p\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>CP 852\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">┴\u003C/span>RV\u003Cspan style=\"color: red;\">═\u003C/span>ZT\u003Cspan style=\"color: red;\">█\u003C/span>R\u003Cspan style=\"color: red;\">Ň\u003C/span> T\u003Cspan style=\"color: red;\">▄\u003C/span>KK\u003Cspan style=\"color: red;\">I\u003C/span>RF\u003Cspan style=\"color: red;\">┌\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span>G\u003Cspan style=\"color: red;\">╔\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">ß\u003C/span>rv\u003Cspan style=\"color: red;\">I\u003C/span>Gerenciamento de contas\u003Cspan style=\"color: red;\">#\u003C/span> )\u003Cspan style=\"color: red;\">Telecomunicações\u003C/span>k\u003Cspan style=\"color: red;\">÷\u003C/span>R.\u003Cspan style=\"color: red;\">;\u003C/span>R\u003Cspan style=\"color: red;\">:\u003C/span>g\u003Cspan style=\"color: red;\">Ú\u003C/span>p\n\u003C/td>\u003Ctd>Ambas as codificações são da Europa Central, mas o texto é codificado com a codificação do Windows e decodificado com a codificação DOS. O uso do ű está correto.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"2\">Windows-1252\n\u003C/th>\u003Ctd>ÁRVÍZT\u003Cspan style=\"color: red;\">- Sim.\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> TÜKÖRFÚRÓGÉPRIO\u003Cbr/>O que é isso?\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">?\u003C/span> O que fazer?\n\u003C/td>\u003Ctd>A codificação padrão do Windows da Europa Ocidental é usada em vez da central-europeia. Apenas ő-. (õ-.) e ű-. (û-š) estão errados, e o texto é completamente legível. Este é o erro mais comum hoje em dia; devido à ignorância, ocorre muitas vezes em páginas web ou mesmo em mídia impressa.\n\u003C/td>\u003C/tr>\u003Ctr id=\"HungarianUTF8\">\u003Cth rowspan=\"2\">UTF-8\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">\u003C/span>RV\u003Cspan style=\"color: red;\">À vontade\u003C/span>ZT\u003Cspan style=\"color: red;\">Å\u003C/span>R\u003Cspan style=\"color: red;\">Å\u003C/span> T\u003Cspan style=\"color: red;\">O quê?\u003C/span>KK\u003Cspan style=\"color: red;\">,\u003C/span>RF\u003Cspan style=\"color: red;\">Não.\u003C/span>R\u003Cspan style=\"color: red;\">\"A\"\u003C/span>G\u003Cspan style=\"color: red;\">(em inglês)\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">?\u003C/span>rv\u003Cspan style=\"color: red;\">?\u003C/span>O quê?\u003Cspan style=\"color: red;\">Å\u003C/span>R\u003Cspan style=\"color: red;\">Å '\u003C/span> )\u003Cspan style=\"color: red;\">1⁄4\u003C/span>k\u003Cspan style=\"color: red;\">#\u003C/span>R.\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">A3\u003C/span>g\u003Cspan style=\"color: red;\">Está bem.\u003C/span>p\n\u003C/td>\u003Ctd rowspan=\"2\">Principalmente causada por serviços web ou clientes de webmail que são configurados incorretamente ou não testados para uso internacional (como o problema permanece oculto para textos em inglês). Neste caso, o conteúdo real (muitas vezes gerado) está em UTF-8, mas algum software mais antigo pode ser padrão para codificações localizadas se o UTF-8 não for explicitamente especificado nos cabeçalhos HTML.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Mac Roman.\n\u003C/th>\u003Ctd>\u003Cspan style=\"color: red;\">√Å\u003C/span>RV\u003Cspan style=\"color: red;\">√Ç\u003C/span>ZT\u003Cspan style=\"color: red;\">≈∞\u003C/span>R\u003Cspan style=\"color: red;\">≈\u003C/span> T\u003Cspan style=\"color: red;\">√ú\u003C/span>KK\u003Cspan style=\"color: red;\">√ñ\u003C/span>RF\u003Cspan style=\"color: red;\">√ö\u003C/span>R\u003Cspan style=\"color: red;\">√ì\u003C/span>G\u003Cspan style=\"color: red;\">√â\u003C/span>P\u003Cbr/>\u003Cspan style=\"color: red;\">√°\u003C/span>rv\u003Cspan style=\"color: red;\">√ Competição\u003C/span>O quê?\u003Cspan style=\"color: red;\">?\u003C/span>R\u003Cspan style=\"color: red;\">≈\u003C/span> )\u003Cspan style=\"color: red;\">√°\u003C/span>k\u003Cspan style=\"color: red;\">√∂\u003C/span>R.\u003Cspan style=\"color: red;\">√∫\u003C/span>R\u003Cspan style=\"color: red;\">√≥\u003C/span>g\u003Cspan style=\"color: red;\">√©\u003C/span>p\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Polish\">Polonês\u003C/h4>\u003C/div>\u003Cp> Antes da criação da ISO 8859-2 em 1987, os usuários de várias plataformas de computação usaram suas próprias codificações de personagens, como o AmigaPl no Amiga, o Atari Club em Atari St e Masovia, IBM CP852, Mazovia e Windows CP1250 nos PCs IBM. Empresas poloneses que vendem os primeiros computadores do DOS criaram suas próprias maneiras mutuamente incompatíveis de codificar personagens polonês e simplesmente reprogramar os EPROMs das placas de vídeo (normalmente CGA, EGA ou Hercules) para fornecer páginas de código de hardware com os glifos necessários para o polimento-arbitrariamente localizado sem Referência a onde outros vendedores de computador os colocaram.\n\u003C/p>\u003Cp> A situação começou a melhorar quando, após a pressão dos grupos acadêmicos e de usuários, a ISO 8859-2 foi bem-sucedida como o padrão da Internet " com apoio limitado dos fornecedores dominantes ' software (hoje em grande parte substituído pelo Unicode). Com os numerosos problemas causados pela variedade de codificações, ainda hoje alguns usuários tendem a se referir aos caracteres diacríticos polires como \u003Cspan title = \"text de língua polonesa\"> \u003Ci lang = \"pl\"> krzaczki \u003C/i> \u003C/span > (\u003Cspan class = \"ipa nowrap\" lang = \"und-latn-fonipa\" title = \"Representação no alfabeto fonético internacional (IPA)\"> [ˈkʂät͜ʂ.ki] \u003C/span>, lit. " Little; arbustos ").\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Russian_and_other_Cyrillic-based_alphabets\">alfabetos russos e outros baseados em cirílicos \u003C/h4>\u003C/div>\u003Cp> mojibake é chamado coloquialmente \u003Cspan title = \"texto russo-língua\"> \u003Ci lang = \"ru-latn\"> krakozyabry \u003C/i> \u003C/span> (\u003Ctitle span = \"texto russo-language\"> \u003C span lang = \"ru\"> краtichз́́ры \u003C/span> \u003C/span> \u003Cspan class = \"ipa nowrap\" lang = \"ru-latn-fonipa\"> [krɐkɐˈzʲæbrɪ̈] \u003C/span>) em russo, que foi e permanece complicado por vários sistemas para codificar cirílico. A União Soviética e o início da Federação Russa desenvolveram codificações KOI (\u003Cspan title = \"texto em língua russa\"> \u003Cspan lang = \"ru-latn\"> kod obmena informatsiey \u003C/span> \u003C/span>, \u003Cspan title = \"russo -Language Text \"> \u003Cspan lang =\" ru \"> ко обpel и и и и и иT\"> к иеффацией \u003C/span> \u003C/span>, que se traduz em codificado para troca de informações "). Isso começou com o KOI7 de 7 bits apenas cirílico, baseado no ASCII, mas com latim e outros personagens substituídos por letras cirílicas. Então veio a codificação de Koi8 de 8 bits, que é uma extensão ASCII que codifica letras cirílicas apenas com octetos de alto bit, correspondentes a códigos de 7 bits de Koi7. É por esse motivo que o texto Koi8, mesmo russo, permanece parcialmente legível depois de tirar o oitavo bit, que foi considerado uma grande vantagem na idade de 8 anos de idade, sistemas de e-mail. Por exemplo, as palavras " \u003Cspan title = \"Texto da língua russa\"> \u003Cspan lang = \"ru\"> ш genо р ш ш шшу рш шшшу шшшу шшшу шшшуу шш ш шш шш шш ш ш ш ш ш ш ш ш rusian) \u003C34; (\u003Cspan title = \"texto em língua russa\"> \u003Ci lang = \"ru-latn\"> shkola russkogo yazyka \u003C/i> \u003C/span>), quando codificada em koi8 e passou pelo processo de remoção de bits, acabar sendo renderizado como " [Kola Russkogo Qzyka ". Eventualmente, o Koi8 ganhou sabores diferentes para russo e búlgaro (Koi8-R), ucraniano (Koi8-U), Bielorrusso (Koi8-Ru) e até Tajik (Koi8-T).\n\u003C/p>\u003Cp> Enquanto isso, no oeste, o Código da Page 866 apoiava ucraniano e bielorrusso, além de russo e búlgaro no MS-DOS. Para o Microsoft Windows, o código da página 1251 adicionou suporte para variantes sérvias e outras eslavas do cirílico.\n\u003C/p>\u003Cp> Mais recentemente, a codificação do Unicode inclui pontos de código para praticamente todos os caracteres em todos os idiomas, incluindo todos os caracteres cirílicos.\n\u003C/p>\u003Cp> Antes do Unicode, era necessário corresponder a codificação de texto com uma fonte usando o mesmo sistema de codificação; Não fazer isso produzido sem ilegação, cuja aparência específica variava dependendo da combinação exata de texto e codificação de fontes. Por exemplo, tentando ver o texto cirílico não unicode usando uma fonte limitada ao alfabeto latino, ou usando o padrão (" Western ") codificando, normalmente resulta em texto que consiste quase inteiramente de vogais capitalizadas com Marcas diacríticas (por exemplo, Koi8 " \u003Cspan title = \"Texto da língua russa\"> \u003Cspan Lang = \"Ru\"> бииботperar Texto \"> \u003Ci lang =\" ru-latn \"> biblioteka \u003C/i> \u003C/span>, biblioteca) torna-se \"Texto em língua russa\"> \u003Ci lang = \"ru-latn\"> shkola russkogo yazyka \u003C/i> \u003C/span>, escola de língua russa) torna-se " ûëïìá òõó ë € ñúùëá "). Usando o código página 1251 para visualizar o texto em koi8, ou vice -versa, resulta em texto distorcido que consiste principalmente em letras maiúsculas (koi8 e code 1251 compartilham a mesma região ASCII, mas o koi8 possui letras maiúsculas na região em que o código Page 1251 tem minúscula baixa e vice -versa).\n\u003C/p>\u003Cp> Durante os primeiros anos do setor russo da World Wide Web, foram comuns o Koi8 e o Código. Quase todos os sites agora usam Unicode, mas em novembro de 2023, estima-se que 0,35% de todas as páginas da Web em todo o mundo-todos os idiomas incluídos-ainda estão codificados na página 1251, enquanto menos de 0,003% dos sites ainda estão codificados no KOI8-R. Embora o padrão HTML inclua a capacidade de especificar a codificação para qualquer página da Web em sua fonte, isso às vezes é negligenciado, forçando o usuário a alternar as codificações no navegador manualmente.\n\u003C/p>\u003Cp> Em búlgaro, o mojibake é frequentemente chamado \u003Cspan title = \"texto da língua búlgara\"> \u003Ci lang = \"bg-latn\"> majmunica \u003C/i> \u003C/span> (\u003Cspan title = \"texto búlgaro-língua-language \"> \u003Cspan lang =\" bg \"> майнница \u003C/span> \u003C/span>), significando\" Monkey ' s [alfabeto] ". Em sérvio, é chamado \u003Cspan title = \"texto em língua sérvia\"> \u003Ci lang = \"sr-latn\"> đubre \u003C/i> \u003C/span> (\u003Ctitle span = \"texto sérvio-language\"> \u003Cspan Lang = \"sr\"> - - \u003C/span> \u003C/span>), significando " lixo ". Ao contrário da antiga URSS, os eslavos do sul nunca usaram algo como Koi8, e o código da codificação cirílico dominante antes do unicode; Portanto, esses idiomas sofreram menos problemas de incompatibilidade do que o russo. Na década de 1980, os computadores búlgaros usaram sua própria codificação MIK, que é superficialmente semelhante a (embora incompatível com) CP866.\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ccaption>Exemplo\n\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Texto original\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"12\" style=\"text-align: center;\">\u003Cspan title=\"Russian-language text\">\u003Cspan lang=\"ru\">Telecomunicações\u003C/span>\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Windows-1251\u003C/td>\u003Ctd>KOI8-R\u003C/td>\u003Ctd>й й А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"2\">KOI8-R\u003C/td>\u003Ctd>Windows-1251\u003C/td>\u003Ctd>- Não.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"4\">Windows-1252\u003C/td>\u003Ctd>O que se passa?\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>MS-DOS 855\u003C/td>\u003Ctd>ÇO ÆÖO FORMAÇÃO\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Windows-1251\u003C/td>\u003Ctd>O que é isso?\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"6\">UTF-8\u003C/td>\u003Ctd>PRESIDÊNCIA: N.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>KOI8-R\u003C/td>\u003Ctd>п─п─п─п─п─ппяпппп─п─я─я─я─я─я─я▀\u003Cbr/>\u003Ci>(O segundo personagem é um espaço não quebrado)\u003C/i>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>MS-DOS 855\u003C/td>\u003Ctd>лЛЛлл║л║л║л║лиЛлл▒ЛЛЛЛЛІ\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Windows-1251\u003C/td>\u003Ctd>ССРРРРРРРРРРСРРРРРР СССЂР С±Р±Р±Р СРРРРРР СРРРР СРРРР СРР±Р±Р±Р± С±Р±Р±РР СРРРРРРР СРР±РРРРРРРР СРРРРР СР СРР± СРР±Р±РРРРРРР±РРРРРРРРР±РРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРРР СР СР СР СРРР СРРР СР СРРР СРРРРР Р СРРРРР СРРР Р РРРРРРР РРРРР\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Mac Roman.\u003C/td>\u003Ctd>–ö—Ä–∞–∫–æ–,—è–±— Ä\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Mac Cyrillic\u003C/td>\u003Ctd>–А—А–∞–А–А–А—П–±—А—Л\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Yugoslav_languages\">Línguas jugoslavas\u003C/h4>\u003C/div>\u003Cp>Croatian, Bosnian, Serbian (the seceding varieties of Serbo-Croatian language) and Slovenian add to the basic Latin alphabet the letters š, đ, č, ć, ž, and their capital counterparts Š, Đ, Č, Ć, Ž (apenas Č/Č, Š/Š e Ž/Ž em Eslovena; oficialmente, embora outros sejam usados quando necessário, principalmente em nomes estrangeiros). Todas essas letras são definidas no Latin-2 e no Windows-1250, enquanto apenas algumas (Š, Š, Ž, Ž, đ) existem no Windows-1252 habitual de OS-default e estão lá por causa de alguns outros idiomas.\n\u003C/p>\u003Cp> Embora o Mojibake possa ocorrer com qualquer um desses caracteres, as letras que não estão incluídas no Windows-1252 são muito mais propensas a erros. Assim, mesmo hoje em dia, " Šđ olhćž Šđčćž " é frequentemente exibido como \"Šðèž Šðèæž ", embora, è, e æ nunca sejam usados em línguas eslavas.\n\u003C/p>\u003Cp> Quando confinado ao ASCII básico (a maioria dos nomes de usuário, por exemplo), as substituições comuns são: Š → S, đ → DJ, Č → C, ć → C, Ž → Z (capital se forma analogamente, com đ → dj ou Đ → DJ, dependendo do caso do Word). Todas essas substituições introduzem ambiguidades, portanto, a reconstrução do original a partir desse formulário é geralmente feita manualmente, se necessário.\n\u003C/p>\u003Cp> A codificação do Windows-1252 é importante porque as versões em inglês do sistema operacional Windows são mais difundidas, não localizadas. As razões para isso incluem um mercado relativamente pequeno e fragmentado, aumentando o preço da localização de alta qualidade, um alto grau de pirataria de software (por sua vez causado pelo alto preço do software em comparação com a renda), que desencoraja os esforços de localização, e as pessoas preferem versões em inglês de Windows e outro software.\n\u003C/p>\u003Cp> O caminho para diferenciar croata de sérvio, bósnio de croata e sérvio e agora até montenegrina dos outros três cria muitos problemas. Existem muitas localizações diferentes, usando padrões diferentes e de qualidade diferente. Não há traduções comuns para a grande quantidade de terminologia do computador originária em inglês. No final, as pessoas usam palavras de empréstimos em inglês (" Kompjuter " para \"Computador\", Kompajlirati " para \"compilação\"; E se eles não estiverem acostumados aos termos traduzidos, eles podem não entender o que alguma opção em um menu deve fazer com base na frase traduzida. Portanto, as pessoas que entendem o inglês, assim como as que estão acostumadas à terminologia do inglês (que são mais, porque a terminologia do inglês também é ensinada principalmente nas escolas por causa desses problemas) escolhem regularmente as versões inglesas originais do software não especialista.\n\u003C/p>\u003Cp> Quando o script cirílico é usado (para macedônio e parcialmente sérvio), o problema é semelhante a outros scripts baseados em cirílico.\n\u003C/p>\u003Cp> Versões mais recentes das janelas em inglês permitem que a página de código seja alterada (as versões mais antigas exigem versões especiais em inglês com esse suporte), mas essa configuração pode ser e muitas vezes foi definida incorretamente. Por exemplo, o Windows 98 e o Windows ME podem ser definidos como a maioria das páginas de código de byte único não-de-direita à esquerda, incluindo 1250, mas apenas no horário de instalação.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Caucasian_languages\">Línguas caucasianas\u003C/h3>\u003C/div>\u003Cp> Os sistemas de escrita de certos idiomas da região do Cáucaso, incluindo os scripts da georgiana e armênia, podem produzir mojibake. Esse problema é particularmente agudo no caso de Armscii ou Armscii, um conjunto de codificações obsoletas de caracteres para o alfabeto armênio que foram substituídos pelos padrões Unicode. O ARMSCII não é amplamente utilizado devido à falta de apoio na indústria de computadores. Por exemplo, o Microsoft Windows não suporta.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Asian_encodings\">Codificações asiáticas\u003C/h3>\u003C/div>\u003Cp> Outro tipo de mojibake ocorre quando o texto codificado em uma codificação de um único byte é erroneamente analisado em uma codificação de vários bytes, como uma das codificações para idiomas do leste asiático. Com esse tipo de mojibake, mais de um (normalmente dois) caracteres são corrompidos de uma só vez. Por exemplo, se a palavra sueca \u003Cspan title = \"texto em língua sueca\"> \u003Ci lang = \"sv\"> kärlek \u003C/i> \u003C/span> estiver codificada no Windows-1252, mas decodificada usando GBK, ele aparecerá como como aparecerá como " é analisado como '#34; 鋜 鋜 鋜 鋜 鋜 鋜#34;. Comparado ao mojibake acima, isso é mais difícil de ler, já que as cartas não relacionadas ao problemático Å, ä ou Ö estão ausentes e são especialmente problemáticas para palavras curtas, começando com Å, ä ou Ö (por exemplo, " än " torna -se " 鋘 鋘 鋘#34;). Como duas letras são combinadas, o mojibake também parece mais aleatório (mais de 50 variantes em comparação com os três normais, sem contar as capitais mais raras). Em alguns casos raros, uma sequência de texto inteira que inclui um padrão de comprimentos de palavras específicos, como a frase \", Bush escondeu os fatos\" pode ser mal interpretada.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Vietnamese\">Vietnamita\u003C/h4>\u003C/div>\u003Cp> Em vietnamita, o fenômeno é chamado \u003Ci> chữ ma \u003C/i> (hán - nôm: 𡨸魔, " caracteres fantasmas ") ou \u003Ci> lOạn Mã (do chinês乱码, \u003Ci> luànmǎ \u003C/i>). Pode ocorrer quando um computador tenta decodificar o texto codificado no UTF-8 como Windows-1258, TCVN3 ou VNI. No Vietnã, \u003Ci> chữ ma \u003C/i> era comumente visto em computadores que executavam versões pré-vistas de janelas ou telefones celulares baratos.\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ccaption>\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Exemplo\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"5\">\u003Cb>Anúncio grátis para sua empresa\u003C/b>\u003Cbr/>\u003Cb>𤾓𢆥𥪞𡎝𠊛些\u003C/b>\u003Cbr/>(\u003Ci>Truyện Kiuu\u003C/i>, Nguyen Du)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"4\">UTF-8\n\u003C/td>\u003Ctd>Windows-1258\n\u003C/td>\u003Ctd>T.\u003Cspan style=\"color: red;\">?\u003C/span>MN\u003Cspan style=\"color: red;\">?\u003C/span>m trong c\u003Cspan style=\"color: red;\">μ\u003C/span>Ing\u003Cspan style=\"color: red;\">Eh!\u003C/span>Eu...\u003Cbr/>\u003Cspan style=\"color: red;\">PRESIDÊNCIA: S.A.\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>TCVN3\n\u003C/td>\u003Ctd>T.\u003Cspan style=\"color: red;\">\"\u003C/span>MN\u003Cspan style=\"color: red;\">\"\u003C/span>m trong c\u003Cspan style=\"color: red;\">\"\u003C/span>Ing\u003Cspan style=\"color: red;\">?\u003C/span>Eu...\u003Cbr/>\u003Cspan style=\"color: red;\">¥ ¥ ¥ ¥ ¥ ¥ ¥\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>VNI (Windows)\n\u003C/td>\u003Ctd>T.\u003Cspan style=\"color: red;\">a ser\u003C/span>MN\u003Cspan style=\"color: red;\">a ser\u003C/span>m trong c\u003Cspan style=\"color: red;\">O quê?\u003C/span>Ing\u003Cspan style=\"color: red;\">?\u003C/span>Eu...\u003Cbr/>\u003Cspan style=\"color: red;\">\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Mac Roman.\n\u003C/td>\u003Ctd>T.\u003Cspan style=\"color: red;\">Ç\u003C/span>MN\u003Cspan style=\"color: red;\">Ç\u003C/span>m trong c\u003Cspan style=\"color: red;\">√μμ\u003C/span>Ing\u003Cspan style=\"color: red;\">Gerenciamento de contas\u003C/span>Eu...\u003Cbr/>\u003Cspan style=\"color: red;\">∫ ¢ ¢ Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫\u003C/span>\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Japanese\">Japonês\u003C/h4>\u003C/div>\u003Cp> No Japão, o Mojibake é especialmente problemático, pois existem muitas codificações de texto japonês diferentes. Juntamente com as codificações Unicode (UTF-8 e UTF-16), existem outras codificações padrão, como Shift-Jis (Máquinas Windows) e EUC-JP (Sistemas UNIX). Até hoje, Mojibake é frequentemente encontrado pelo povo japonês e não japonês ao tentar executar software escrito para o mercado japonês.\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ccaption>\u003C/caption>\u003Ctbody>\u003Ctr>\u003Cth>Texto original\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"10\"> のメールの様の様の様の様のメージす ジ 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 ジ ジ 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 様 \n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"7\">UTF-8\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>UTF-7\u003C/td>\u003Ctd>Ø ( q Y _ C G b g)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>EUC-JP\u003C/td>\u003Ctd>\u003C \u003C 若 吾 吾 吾 吾 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若 若\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Shift-JIS\u003C/td>\u003Ctd>シ シシシフッッッ ァ∈∈ョョョ シシシクァァ€\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Mac Roman.\u003C/td>\u003Ctd>„ Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å Å\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>ISO 8859-6\u003C/td>\u003Ctd>ك ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ك ك ك ك ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه ه\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"3\">Windows-1252\u003C/td>\u003Ctd>̄ ̄ ̄ ̄ ƒ ƒ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>EUC-JP\u003C/td>\u003Ctd>¤ 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 1⁄4 Ç Ç Ç Ç Ç Ç Ç Ç £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £ £\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>Shift-JIS\u003C/td>\u003Ctd>¿Qué estás a falar?\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Chinese\">Chinês\u003C/h4>\u003C/div>\u003Cp> Em chinês, o mesmo fenômeno é chamado \u003Ci> luàn mǎ \u003C/i> (pinyin, chinês simplificado \u003Cspan title = \"texto em chinês\"> \u003Cspan lang = \"zh-hans\"> 乱码 \u003C/span > \u003C/span>, chinês tradicional \u003Cspan title = \"texto em língua chinesa\"> \u003Cspan lang = \"zh-hant\"> 亂碼 \u003C/span> \u003C/span>, significado ' código caótico ') , e pode ocorrer quando o texto computadorizado é codificado em uma codificação de caracteres chineses, mas é exibida usando a codificação errada. Quando isso ocorre, geralmente é possível corrigir o problema alternando a codificação do caractere sem perda de dados. A situação é complicada devido à existência de vários sistemas de codificação de caracteres chineses em uso, sendo os mais comuns: Unicode, Big5 e Guobiao (com várias versões compatíveis com atraso) e a possibilidade de caracteres chineses serem codificados usando a codificação japonesa.\n\u003C/p>\u003Cp> É relativamente fácil identificar a codificação original quando \u003Ci> lu -nmǎ ocorre nas codificações de Guobiao:\n\u003C/p>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ctbody>\u003Ctr>\u003Cth>Texto original\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\u003C/th>\u003Cth>Nota\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd>三國\n\u003C/td>\u003Ctd>Grande.\n\u003C/td>\u003Ctd rowspan=\"3\">GB\n\u003C/td>\u003Ctd>\u003Cspan style=\"color: red;\">\u003C/span>Linha de produção\n\u003C/td>\u003Ctd>Personagens arquivados com quase nenhuma dica de significado original. O caráter vermelho não é um código válido em \u003Cspan class=\"nowrap\">GB 2312\u003C/span>.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>文化ナステスト\n\u003C/td>\u003Ctd>Shift-JIS\n\u003C/td>\u003Ctd>暥帤壔偗僥僗僩\n\u003C/td>\u003Ctd>Kana é exibido como caracteres com o : (chinês: \u003Cspan lang=\"zh\">人人旁\u003C/span>Não. \u003Ci>\u003Cspan lang=\"zh-Latn\">Anúncio grátis para sua empresa\u003C/span>\u003C/i>) radical, enquanto kanji são outros personagens. Muitos dos personagens substitutos são extremamente incomuns em chinês moderno. Um pouco fácil de identificar devido à presença de vários caracteres . consecutivos.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd>이 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스 스\n\u003C/td>\u003Ctd>EUC-KR\n\u003C/td>\u003Ctd>抛农聪墨\n\u003C/td>\u003Ctd>Personagens simplificados aleatórios que na maioria dos casos não fazem sentido. Provavelmente o mais fácil de identificar por causa de espaços entre cada vários personagens.\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cp> Um problema adicional em chinês ocorre quando caracteres raros ou antiquados, muitos dos quais ainda são usados em nomes pessoais ou de lugares, não existem em algumas codificações. Exemplos disso são:\n\u003C/p>\u003Cul>\u003Cli>A falta de codificação Big5 do \"s\" (\u003Ci>xuan\u003C/i>) em nome do político taiwanês Wang Chien-shien (chinês: \u003Cspan lang=\"zh-Hant\">王建\u003C/span>Não. \u003Ci>\u003Cspan lang=\"zh-Latn\">Wáng Jiànxuan\u003C/span>\u003C/i>), o \"\"\" (\u003Ci>Não.\u003C/i>) em nome de Yu Shyi-kun (chinês simplificado: \u003Cspan lang=\"zh-Hans\">游\u003C/span>; chinês tradicional: \u003Cspan lang=\"zh-Hant\">O quê?\u003C/span>Não. \u003Ci>\u003Cspan lang=\"zh-Latn\">Sim.\u003C/span>\u003C/i>), e o \"\"\" (\u003Ci>zhé\u003C/i>) em nome do cantor David Tao (chinês: \u003Cspan lang=\"zh-Hant\">陶喆\u003C/span>Não. \u003Ci>\u003Cspan lang=\"zh-Latn\">Táo Zhé\u003C/span>\u003C/i>),\u003C/li>\u003Cli>A falta de GB 2312 do \"s\" (\u003Ci>O quê?\u003C/i>) em ex-PRC Premier Zhu Rongji (chinês: \u003Cspan lang=\"zh\">朱镕基\u003C/span>Não. \u003Ci>\u003Cspan lang=\"zh-Latn\">Zhū Róngjī\u003C/span>\u003C/i>), e\u003C/li>\u003Cli>A falta do símbolo de direitos autorais \"©\".\u003C/li>\u003C/ul>\u003Cp> Os jornais lidaram com caracteres ausentes de várias maneiras, incluindo o uso de software de edição de imagens para sintetizá -los combinando outros radicais e caracteres; Usando uma imagem das personalidades (no caso dos nomes das pessoas), ou simplesmente substituindo os homofones na esperança de que os leitores possam fazer a inferência correta.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Indic_text\">Texto indício\u003C/h4>\u003C/div>\u003Cp> Um efeito semelhante pode ocorrer em scripts brâmanes ou indicados do sul da Ásia, usados em idiomas indo-arianos ou indicadores como hindustani (hindi-urdu), bengali, punjabi, marathi e outros, mesmo que o conjunto de personagens seja empregado reconhecido corretamente pelo aplicativo. Isso ocorre porque, em muitos scripts indicados, as regras pelas quais os símbolos de cartas individuais se combinam para criar símbolos para sílabas podem não ser adequadamente entendidos por um computador que falta o software apropriado, mesmo que os glifos para os formulários de letra individuais estejam disponíveis.\n\u003C/p>\u003Cp> Um exemplo disso é o antigo logotipo da Wikipedia, que tenta mostrar o personagem análogo a " Wi " (A primeira sílaba da Wikipedia ") Em cada uma das muitas peças do quebra -cabeça. A peça do quebra -cabeça destinada a suportar o personagem Devanagari por " Wi " Em vez disso, usado para exibir o " wa " Personagem seguido por um não pareado " i " vogal modificador, facilmente reconhecível como mojibake gerado por um computador não configurado para exibir texto indic. O logotipo tão redesenhado em maio de 2010 corrigiu esses erros.\n\u003C/p>\u003Cp> A idéia do texto simples exige que o sistema operacional forneça uma fonte para exibir códigos Unicode. Essa fonte é diferente de OS para OS para Singhala e torna os glifos ortograficamente incorretos para algumas letras (sílabas) em todos os sistemas operacionais. Por exemplo, o ' Reph ', o formulário curto para ' r ' é um diacrítico que normalmente fica em cima de uma letra simples. No entanto, é errado ir ao topo de algumas cartas como ' YA ' ou ' la ' em contextos específicos. Para palavras ou nomes sânscríticos herdados por idiomas modernos, como कार्य, IAST: \u003Ci> kārya \u003C/i> ou आर्या, iAST: \u003Ci> āryā \u003C/i>, é adequado para colocá -lo em cima dessas letras . Por outro lado, para sons semelhantes em idiomas modernos que resultam de suas regras específicas, não é colocado no topo, como a palavra करणाऱ्या, iAST: \u003Ci> karaṇāryā \u003C/i>, uma forma de haste da palavra comum करणारा/ी ी gre , IAST: \u003Ci> karaṇārā/rī \u003C/i>, na língua marathi. Mas isso acontece na maioria dos sistemas operacionais. Isso parece ser uma falha da programação interna das fontes. Em Mac OS e iOS, o Muurdhaja L (Dark L) e ' U ' a combinação e sua forma longa produzem formas erradas.\n\u003C/p>\u003Cp> Alguns scripts indic e indicados, principalmente o Laos, não foram oficialmente apoiados pelo Windows XP até o lançamento do Vista. No entanto, vários sites fizeram fontes gratuitas para baixar.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Burmese\">Birmânia\u003C/h4>\u003C/div>\u003Cp> Devido às sanções ocidentais e à chegada tardia do apoio à linguagem birmanesa em computadores, grande parte da localização do Birmânia foi caseira sem cooperação internacional. Os meios predominantes de apoio birmaneses são através da fonte Zawgyi, uma fonte criada como uma fonte Unicode, mas na verdade era de fato apenas parcialmente compatível com unicode. Na fonte de Zawgyi, alguns pontos de código para script birmaneses foram implementados conforme especificado no Unicode, mas outros não. O consórcio Unicode refere -se a isso como codificações de fontes \u003Ci> ad hoc \u003C/i>. Com o advento dos telefones celulares, fornecedores móveis como Samsung e Huawei simplesmente substituíram as fontes do sistema compatível com Unicode pelas versões Zawgyi.\n\u003C/p>\u003Cp> Devido a essas codificações \u003Ci> ad hoc \u003C/i>, as comunicações entre usuários de Zawgyi e Unicode renderizariam como texto distorcido. Para contornar esse problema, os produtores de conteúdo faziam postagens em Zawgyi e Unicode. Governo de Mianmar designado em 1 de outubro de 2019 como 'U-Dia' " para mudar oficialmente para Unicode. A transição completa foi estimada em dois anos.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"African_languages\">Línguas africanas\u003C/h3>\u003C/div>\u003Cp> Em certos sistemas de escrita da África, o texto não codificado é ilegível. Os textos que podem produzir mojibake incluem aqueles do chifre da África, como o script ge ' EZ na Etiópia e Eritreia, usado para amárico, tigre e outras línguas, e a língua somali, que emprega o alfabeto de Osmanya. Na África Austral, o alfabeto Mwangwego é usado para escrever idiomas do Malawi e o alfabeto de Mandombe foi criado para a República Democrática do Congo, mas estes geralmente não são apoiados. Vários outros sistemas de escrita nativos da África Ocidental apresentam problemas semelhantes, como o alfabeto n '\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading3\">\u003Ch3 id=\"Arabic\">Árabe\u003C/h3>\u003C/div>\u003Cp> Outra linguagem afetada é o árabe (veja abaixo), no qual o texto se torna completamente ilegível quando as codificações não correspondem.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading4\">\u003Ch4 id=\"Examples_2\">Exemplos\u003C/h4>\u003C/div>\u003Ctable class=\"wikitable\" style=\"text-align: center;\">\u003Ctbody>\u003Ctr class=\"hintergrundfarbe6\">\u003Cth>Exemplo árabe\u003C/th>\u003Cth>renderização do navegador\u003C/th>\u003Cth>Codificação de fontes\u003C/th>\u003Cth>Codificação de alvos\u003C/th>\u003Cth>Resultado\n\u003C/th>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"16\">\u003Cspan typeof=\"mw:File\">\u003Cspan>\u003Cimg alt=\"\" class=\"mw-file-element\" data-file-height=\"12\" data-file-width=\"136\" decoding=\"async\" height=\"12\" src=\"https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/140px-Arabic_example.svg.png\" srcset=\"https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/210px-Arabic_example.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/0/0e/Arabic_example.svg/280px-Arabic_example.svg.png 2x\" width=\"140\"/>\u003C/span>\u003C/span>\u003Cbr/>(Declaração Universal dos Direitos Humanos)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd rowspan=\"15\">\u003Cspan title=\"Arabic-language text\">\u003Cspan dir=\"rtl\" lang=\"ar\">السان الالعالمي لحقوق الالان الان الان الان الان الان الان الان الالان ان الان الان ان ان ان ال ال ال ان ان ال ان ال ال ال ال ال ال ال ال ال ان ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ا ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ال ا ا ال \u003C/span>\u003C/span>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"11\">UTF-8\u003C/th>\u003Cth>KOI8-R\n\u003C/th>\u003Ctd>ьььььььььььы├ь├ы├ы┴ь┬ь┬ь┬ы┴ы┴ы┴ ы┴ь┬ы┬ы┬ы┌ы┌ ь┌ььььььььы┌ ьы┌ы┌ ь ьььььы┌ы┌ ь ьь┌ы┌ ьь┌ьььь - Sim.\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1250\n\u003C/th>\u003Ctd>Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř ≤ Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř Ř\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1251\n\u003C/th>\u003Ctd>Ш (em inglês) (em inglês) Ш§ШNoШ Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1252\n\u003C/th>\u003Ctd>Ø Ø Ø Ø „ „ „ „ „ Ø Ù Ù Ù Ù ‚ ‚ ‚ Ø ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ ¥ † † † † ... ... ... ... „ „ „ „ „ „ „\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1256\n\u003C/th>\u003Ctd>Consultado em 3 de outubro de 2013 «ط¥ط1ת طρظط§ ط§ ط§ ط§ ط§ ط§ ط§ ط§ ظطظת ‚镇 ط§ ‚ ظط§ط§ط§ ظط§ ط ظ ظطρظ ط ط ط ططρظ ط ط ططρظ ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط ط\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>ISO 8859-5\n\u003C/th>\u003Ctd>й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й йй ий йй й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й й\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>ISO 8859-6\n\u003C/th>\u003Ctd>ظ ظ ظ ع ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ عظ عظ ع ع ع ظ ع ظ ع ظ ع ظ ع ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ ظ\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>CP 852\n\u003C/th>\u003Ctd>│ ć ć ć ć ć │ │ │ ć ć ě │ ě ě ě ć ć ć │ │ │ │ ć ć │ │ ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć ć\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>CP 866\n\u003C/th>\u003Ctd>з зД╪ е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е ВД╪╣╪Д╪╣╪зДД┘Е┘Й ВДВнВВВИВ В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В В Ж\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Mac árabe\n\u003C/th>\u003Ctd>Consultado em 9 de outubro de 2014 عÑ SmartphoneظعÑ Smartphone'عÜ hood'عÑ Smartphone'عÑ عÑ Laptop-عÇ Consultado em 9 de outubro de 2014 hood'عÑ LaptopظعÜ\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"3\">Mac Roman.\n\u003C/th>\u003Ctd>ÿ ÿ ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ Ÿ Ÿ Ÿ Ÿ Ÿ ≠ ≠ Ÿ Ÿ Ÿ ≠ ≠ ≠ Ÿ Ÿ ≠ ≠ Ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ Ÿ Ÿ Ÿ Ÿ ≠ ≠ Ÿ Ÿ Ÿ ≠ ≠ ≠ Ÿ Ÿ Ÿ\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Mac árabe\n\u003C/th>\u003Ctd>(em inglês)\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth rowspan=\"2\">Windows-1256\n\u003C/th>\u003Ctd>«···················********************************************************************************************************************************************************************************************************************************************\n\u003C/td>\u003C/tr>\u003Ctr>\u003Cth>Windows-1252\n\u003C/th>\u003Ctd>ÇáÅÚÁÇO ÇáÚÁUA FORMAÇÃO\n\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003Cp> Os exemplos deste artigo não têm UTF-8 como configuração do navegador, porque o UTF-8 é facilmente reconhecível; portanto, se um navegador suportar UTF-8, deve reconhecê-lo automaticamente e não tentar interpretar outra coisa como UTF- 8.\n\u003C/p>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"See_also\">Ver também\u003C/h2>\u003C/div>\u003Cul>\u003Cli>Ponto de referência\u003C/li>\u003Cli>Característica de substituição\u003C/li>\u003Cli>Característica do substituto\u003C/li>\u003Cli>Newline – As convenções para representar a quebra de linha diferem entre sistemas Windows e Unix. Embora a maioria dos softwares suporta ambas as convenções (que é trivial), software que deve preservar ou exibir a diferença (por exemplo, sistemas de controle de versão e ferramentas de comparação de dados) pode ficar substancialmente mais difícil de usar se não aderir a uma convenção.\u003C/li>\u003Cli>Marca de ordem byte – A maneira mais em banda de armazenar a codificação junto com os dados - prepend it. Isto é pela intenção invisível para os seres humanos usando software compatível, mas será percebido por design como \"personagens de criança\" para software incompatível (incluindo muitos intérpretes).\u003C/li>\u003Cli>entidades HTML – Uma codificação de caracteres especiais em HTML, principalmente opcional, mas necessário para certos caracteres escapar da interpretação como marcação. Embora a falha em aplicar esta transformação seja uma vulnerabilidade (ver scripting cross-site), aplicá-lo muitas vezes resulta em garbling desses caracteres. Por exemplo, a marca de cotação \u003Ccode>\"\u003C/code> torna-se \u003Ccode>"\u003C/code>, \u003Ccode>&quot;\u003C/code>, \u003Ccode>&amp;quot;\u003C/code> e assim por diante.\u003C/li>\u003Cli>Bush escondeu os fatos\u003C/li>\u003C/ul>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"References\">Referências\u003C/h2>\u003C/div>\u003Cdiv class=\"reflist\">\u003Cdiv class=\"mw-references-wrap mw-references-columns\">\u003Col class=\"references\">\u003Cli id=\"cite_note-ieee-1\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation journal cs1\" id=\"CITEREFKing2012\">King, Ritchie (2012). \"O Unicode em breve será o código universal? [The Data]» (em inglês). \u003Ci>IEEE Spectrum\u003C/i>. \u003Cb>49\u003C/b> (7): 60. doi:10.1109/MSPEC.2012.6221090.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.jtitle=IEEE+Spectrum&rft.atitle=Will+unicode+soon+be+the+universal+code%3F+%26%2391%3BThe+Data%26%2393%3B&rft.volume=49&rft.issue=7&rft.pages=60&rft.date=2012&rft_id=info%3Adoi%2F10.1109%2FMSPEC.2012.6221090&rft.aulast=King&rft.aufirst=Ritchie&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-2\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\" id=\"CITEREFWINDISCHMANN2004\">WINDISCHMANN, Stephan (31 de março de 2004). «curl -v linux.ars (Internationalization)» (em inglês). \u003Ci>Ars Technica\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">5 de Outubro\u003C/span> 2018\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Ars+Technica&rft.atitle=curl+-v+linux.ars+%28Internationalization%29&rft.date=2004-03-31&rft.aulast=WINDISCHMANN&rft.aufirst=Stephan&rft_id=https%3A%2F%2Farstechnica.com%2Finformation-technology%2F2004%2F03%2Flinux-20040331%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-3\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Guidelines for extended atributos» (em inglês). 2013-05-17\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">2015-02-15\u003C/span>\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Guidelines+for+extended+attributes&rft.date=2013-05-17&rft_id=http%3A%2F%2Fwww.freedesktop.org%2Fwiki%2FCommonExtendedAttributes&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-4\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Unicode mailinglist on the Eudora email client» (em inglês). 2001-05-13\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">2014-11-01\u003C/span>\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Unicode+mailinglist+on+the+Eudora+email+client&rft.date=2001-05-13&rft_id=https%3A%2F%2Fwww.unicode.org%2Fmail-arch%2Funicode-ml%2Fy2001-m07%2F0355.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-5\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1 cs1-prop-foreign-lang-source\">«sms-scam» (em norueguês). 18 de junho de 2014\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">19 de junho,\u003C/span> 2014\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=sms-scam&rft.date=2014-06-18&rft_id=http%3A%2F%2Ftv2.no%2F2014%2F06%2F18%2Fnyheter%2F5718240&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-6\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">p. 141, \u003Ci>Control + Alt + Delete: Um dicionário de Cyberslang\u003C/i>Jonathon Keats, Globe Pequot, 2007, ISBN 1-59921-039-8.\u003C/span>\u003C/li>\u003Cli id=\"cite_note-7\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Usage statistics of Windows-1251 for websites» (em inglês). \u003Ci>w3techs.com\u003C/i>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=w3techs.com&rft.atitle=Usage+statistics+of+Windows-1251+for+websites&rft_id=https%3A%2F%2Fw3techs.com%2Ftechnologies%2Fdetails%2Fen-windows1251&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-8\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Usage statistics of KOI8-R for websites» (em inglês). \u003Ci>w3techs.com\u003C/i>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=w3techs.com&rft.atitle=Usage+statistics+of+KOI8-R+for+websites&rft_id=https%3A%2F%2Fw3techs.com%2Ftechnologies%2Fdetails%2Fen-koi8r&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-9\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Declaring character encodings in HTML» (em inglês).\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Declaring+character+encodings+in+HTML&rft_id=https%3A%2F%2Fwww.w3schools.com%2FTAGs%2Fatt_meta_charset.asp&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-10\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«PRC GBK (XGB)» (em inglês). \u003Ci>Microsoft Microsoft\u003C/i>. Arquivado do original em 2002-10-01.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Microsoft&rft.atitle=PRC+GBK+%28XGB%29&rft_id=http%3A%2F%2Fwww.microsoft.com%2Ftypography%2Funicode%2F936.txt&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span> Mapa de conversão entre Código página 936 e Unicode. Precisa selecionar manualmente GB 18030 ou GBK no navegador para vê-lo corretamente.\u003C/span>\u003C/li>\u003Cli id=\"cite_note-NYTimes-11\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation news cs1\" id=\"CITEREFCohen2007\">Cohen, Noam (25 de junho de 2007). «Some Errors Defy Corrigs: A Typo in Wikipedia's Logo Fractures the Sanskrit» (em inglês). \u003Ci>The New York Times\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">17 de Julho\u003C/span> 2009\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.jtitle=The+New+York+Times&rft.atitle=Some+Errors+Defy+Fixes%3A+A+Typo+in+Wikipedia%27s+Logo+Fractures+the+Sanskrit&rft.date=2007-06-25&rft.aulast=Cohen&rft.aufirst=Noam&rft_id=https%3A%2F%2Fwww.nytimes.com%2F2007%2F06%2F25%2Ftechnology%2F25wikipedia.html%3F_r%3D2%26oref%3Dslogin&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-12\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Marathi Typing | English to Marathi | Online Marathi Typing» (em inglês). \u003Ci>marathi.com.br\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">2022-08-02\u003C/span>\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=marathi.indiatyping.com&rft.atitle=Marathi+Typing+%7C+English+to+Marathi+%7C+Online+Marathi+Typing&rft_id=https%3A%2F%2Fmarathi.indiatyping.com%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-13\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Content Moved (Windows)» (em inglês). Msdn.microsoft.com\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">2014-02-05\u003C/span>\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=unknown&rft.btitle=Content+Moved+%28Windows%29&rft.pub=Msdn.microsoft.com&rft_id=http%3A%2F%2Fmsdn.microsoft.com%2Fen-us%2Flibrary%2Fms776260%28VS.85%29.aspx&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-japantimes-14\">\u003Cspan class=\"mw-cite-backlink\">↑ a b\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Unicode in, Zawgyi out: Modernity last catches up in Myanmar's digital world» (em inglês). \u003Ci>The Japan Times\u003C/i>. 27 de Setembro de 2019. Arquivado do original em 30 de setembro de 2019\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">24 de Dezembro\u003C/span> 2019\u003C/span>. \u003Cq>1 de outubro é \"U-Day\", quando Myanmar vai adotar oficialmente o novo sistema.... A Microsoft e a Apple ajudaram outros países a padronizar anos atrás, mas as sanções ocidentais significaram que Myanmar perdeu.\u003C/q>\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=The+Japan+Times&rft.atitle=Unicode+in%2C+Zawgyi+out%3A+Modernity+finally+catches+up+in+Myanmar%27s+digital+world&rft.date=2019-09-27&rft_id=https%3A%2F%2Fwww.japantimes.co.jp%2Fnews%2F2019%2F09%2F27%2Fbusiness%2Ftech%2Funicode-in-zawgyi-out-myanmar%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-griffin-15\">\u003Cspan class=\"mw-cite-backlink\">↑ a b\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\" id=\"CITEREFHotchkiss2016\">Hotchkiss, Griffin (23 de março de 2016). «Battle of the fonts». \u003Ci>Fronteira Myanmar\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">24 de Dezembro\u003C/span> 2019\u003C/span>. \u003Cq>Com o lançamento do pacote de serviços do Windows XP 2, scripts complexos foram suportados, o que tornou possível para o Windows renderizar uma fonte Burmese compatível com Unicode, como Myanmar1 (lançado em 2005).... Myazedi, BIT, e mais tarde Zawgyi, circunscreveu o problema de renderização adicionando pontos de código extra que foram reservados para as línguas étnicas de Myanmar. Não só o re-mapping impede o apoio à linguagem étnica futura, também resulta em um sistema de digitação que pode ser confuso e ineficiente, mesmo para usuários experientes.... Huawei e Samsung, as duas marcas de smartphones mais populares em Myanmar, são motivadas apenas capturando a maior quota de mercado, o que significa que eles suportam Zawgyi fora da caixa.\u003C/q>\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Frontier+Myanmar&rft.atitle=Battle+of+the+fonts&rft.date=2016-03-23&rft.aulast=Hotchkiss&rft.aufirst=Griffin&rft_id=https%3A%2F%2Ffrontiermyanmar.net%2Fen%2Ffeatures%2Fbattle-of-the-fonts&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-sin-16\">\u003Cspan class=\"mw-cite-backlink\">↑ a b\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\" id=\"CITEREFSin2019\">Sin, Thant (7 de setembro de 2019). «Unified under one font system as Myanmar prepares to migrate from Zawgyi to Unicode» (em inglês). \u003Ci>Vozes crescentes\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">24 de Dezembro\u003C/span> 2019\u003C/span>. \u003Cq>Padrão Myanmar Fontes Unicode nunca foram mainstreamed ao contrário da fonte privada e parcialmente compatível com Unicode Zawgyi.... Unicode irá melhorar o processamento de linguagem natural\u003C/q>\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Rising+Voices&rft.atitle=Unified+under+one+font+system+as+Myanmar+prepares+to+migrate+from+Zawgyi+to+Unicode&rft.date=2019-09-07&rft.aulast=Sin&rft.aufirst=Thant&rft_id=https%3A%2F%2Frising.globalvoices.org%2Fblog%2F2019%2F09%2F06%2Funified-under-one-font-system-as-myanmar-prepares-to-migrate-from-zawgyi-to-unicode%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-17\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Why Unicode is Needed» (em inglês). \u003Ci>Código do Google: Projeto Zawgyi\u003C/i>\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">31 de Outubro\u003C/span> 2013\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Google+Code%3A+Zawgyi+Project&rft.atitle=Why+Unicode+is+Needed&rft_id=https%3A%2F%2Fcode.google.com%2Fp%2Fzawgyi%2Fwiki%2FWhyUnicode&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-unicode_faq-18\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\">«Myanmar Scripts and Languages» (em inglês). \u003Ci>Perguntas frequentes\u003C/i>. Consórcio de Unicode\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">24 de Dezembro\u003C/span> 2019\u003C/span>. \u003Cq>\u003Cspan class=\"cs1-kern-left\">\u003C/span>\"UTF-8\" tecnicamente não se aplica às codificações de fontes ad hoc, como Zawgyi.\u003C/q>\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Frequently+Asked+Questions&rft.atitle=Myanmar+Scripts+and+Languages&rft_id=https%3A%2F%2Fwww.unicode.org%2Ffaq%2Fmyanmar.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-fb_eng-19\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\" id=\"CITEREFLaGrowPruzan2019\">LaGrow, Nick; Pruzan, Miri (26 de setembro de 2019). «Integrating autoconversion: Facebook's path from Zawgyi to Unicode - Facebook Engineering» (em inglês). \u003Ci>Engenharia do Facebook\u003C/i>. Facebook\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">25 de Dezembro\u003C/span> 2019\u003C/span>. \u003Cq>Ele torna a comunicação em plataformas digitais difíceis, como o conteúdo escrito em Unicode aparece enfeitado para os usuários Zawgyi e vice-versa.... A fim de melhor alcançar seus públicos, os produtores de conteúdo em Myanmar frequentemente postam em Zawgyi e Unicode em um único post, para não mencionar inglês ou outros idiomas.\u003C/q>\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=Facebook+Engineering&rft.atitle=Integrating+autoconversion%3A+Facebook%27s+path+from+Zawgyi+to+Unicode+-+Facebook+Engineering&rft.date=2019-09-26&rft.aulast=LaGrow&rft.aufirst=Nick&rft.au=Pruzan%2C+Miri&rft_id=https%3A%2F%2Fengineering.fb.com%2Fandroid%2Funicode-font-converter%2F&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003Cli id=\"cite_note-mmti_Myan-20\">\u003Cspan class=\"mw-cite-backlink\">\u003Cb>^\u003C/b>\u003C/span> \u003Cspan class=\"reference-text\">\u003Ccite class=\"citation web cs1\" id=\"CITEREFSaw_Yi_Nanda2019\">Saw Yi Nanda (21 de novembro de 2019). «Myanmar switch to Unicode to take two years: app developer» (em inglês). \u003Ci>The Myanmar Times\u003C/i>. Arquivado do original em 24 de dezembro de 2019\u003Cspan class=\"reference-accessdate\">. Retrieved \u003Cspan class=\"nowrap\">24 de Dezembro\u003C/span> 2019\u003C/span>.\u003C/cite>\u003Cspan class=\"Z3988\" title=\"ctx_ver=Z39.88-2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=unknown&rft.jtitle=The+Myanmar+Times&rft.atitle=Myanmar+switch+to+Unicode+to+take+two+years%3A+app+developer&rft.date=2019-11-21&rft.au=Saw+Yi+Nanda&rft_id=https%3A%2F%2Fwww.mmtimes.com%2Fnews%2Fmyanmar-switch-unicode-take-two-years-app-developer.html&rfr_id=info%3Asid%2Fen.wikipedia.org%3AMojibake\">\u003C/span>\u003C/span>\u003C/li>\u003C/ol>\u003C/div>\u003C/div>\u003Cdiv class=\"mw-heading mw-heading2\">\u003Ch2 id=\"External_links\">Ligações externas\u003C/h2>\u003C/div>\u003Cul>\u003Cli>\u003Cspan class=\"noviewer\" typeof=\"mw:File\">\u003Ca class=\"mw-file-description\" href=\"https://en.wikipedia.org/wiki/File:Wiktionary-logo-en-v2.svg\">\u003Cimg alt=\"\" class=\"mw-file-element\" data-file-height=\"512\" data-file-width=\"512\" decoding=\"async\" height=\"16\" src=\"https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/16px-Wiktionary-logo-en-v2.svg.png\" srcset=\"https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/24px-Wiktionary-logo-en-v2.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/32px-Wiktionary-logo-en-v2.svg.png 2x\" width=\"16\"/>\u003C/a>\u003C/span> A definição de dicionário de mojibake em Wiktionary\u003C/li>\u003Cli>\u003Cspan class=\"noviewer\" typeof=\"mw:File\">\u003Ca class=\"mw-file-description\" href=\"https://en.wikipedia.org/wiki/File:Commons-logo.svg\">\u003Cimg alt=\"\" class=\"mw-file-element\" data-file-height=\"1376\" data-file-width=\"1024\" decoding=\"async\" height=\"16\" src=\"https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/12px-Commons-logo.svg.png\" srcset=\"https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/18px-Commons-logo.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/en/thumb/4/4a/Commons-logo.svg/24px-Commons-logo.svg.png 2x\" width=\"12\"/>\u003C/a>\u003C/span> Mídia relacionada ao Mojibake no Wikimedia Commons\u003C/li>\u003C/ul>\u003Cdiv class=\"navbox-styles\">\u003C/div>\u003Cdiv aria-labelledby=\"Character_encodings\" class=\"navbox\" role=\"navigation\" style=\"padding:3px\">\u003Ctable class=\"nowraplinks mw-collapsible autocollapse navbox-inner\" style=\"border-spacing:0;background:transparent;color:inherit\">\u003Ctbody>\u003Ctr>\u003Cth class=\"navbox-title\" colspan=\"2\" scope=\"col\">\u003Cdiv class=\"navbar plainlinks hlist navbar-mini\">\u003Cul>\u003Cli class=\"nv-view\">v\u003C/li>\u003Cli class=\"nv-talk\">)\u003C/li>\u003Cli class=\"nv-edit\">e\u003C/li>\u003C/ul>\u003C/div>\u003Cdiv id=\"Character_encodings\" style=\"font-size:114%;margin:0 4em\">Codificações de caracteres\u003C/div>\u003C/th>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Telecomunicações\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Código do telegrama\n\u003Cul>\u003Cli>Agulha\u003C/li>\u003Cli>Morse\n\u003Cul>\u003Cli>Não latina\u003C/li>\u003Cli>Wabun/Kana\u003C/li>\u003Cli>Chinês\u003C/li>\u003Cli>Cyrillic\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Baudot e Murray\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Campo de batalha\u003C/li>\u003Cli>ASCII\n\u003Cul>\u003Cli>ISO/IEC 646\u003C/li>\u003C/ul>\u003C/li>\u003Cli>BCDIC\u003C/li>\u003Cli>Teletex e Videotex/Teletext\n\u003Cul>\u003Cli>T.51/ISO/IEC 6937\u003C/li>\u003Cli>ITU T.61\u003C/li>\u003Cli>ITU T.101\u003C/li>\u003Cli>Teletexto do Sistema Mundial\n\u003Cul>\u003Cli>fundo\u003C/li>\u003Cli>conjuntos\u003C/li>\u003C/ul>\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Código de transmissão\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">ISO/IEC 8859\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Peças aprovadas\n\u003Cul>\u003Cli>-1 (Europa Ocidental)\u003C/li>\u003Cli>-2 (Europa Central)\u003C/li>\u003Cli>-3 (Maltese/Esperanto)\u003C/li>\u003Cli>-4 (Europa do Norte)\u003C/li>\u003Cli>-5 (cirílico)\u003C/li>\u003Cli>-6 (árabe)\u003C/li>\u003Cli>-7 (em grego)\u003C/li>\u003Cli>-8 (Hebreus)\u003C/li>\u003Cli>-9 (Turquia)\u003C/li>\u003Cli>-10 (Nordic)\u003C/li>\u003Cli>-11 (Thai)\u003C/li>\u003Cli>-13 (háltico)\u003C/li>\u003Cli>-14 (Celtic)\u003C/li>\u003Cli>-15 (Nova Europa Ocidental)\u003C/li>\u003Cli>-16 (Romeno)\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Peças abandonadas\n\u003Cul>\u003Cli>-12 (Devanagari)\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Proposto mas não aprovado\n\u003Cul>\u003Cli>KOI-8 Cyrillic\u003C/li>\u003Cli>Sámi\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Adaptações\n\u003Cul>\u003Cli>Gales\u003C/li>\u003Cli>Barents Cyrillic\u003C/li>\u003Cli>Estônia\u003C/li>\u003Cli>Cirilo ucraniano\u003C/li>\u003C/ul>\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Uso bibliográfico\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>MARC-8\n\u003Cul>\u003Cli>ANSEL\u003C/li>\u003Cli>CCCII/EACC\u003C/li>\u003C/ul>\u003C/li>\u003Cli>ISO 5426\u003C/li>\u003Cli>5426-2\u003C/li>\u003Cli>5427\u003C/li>\u003Cli>5428\u003C/li>\u003Cli>6438\u003C/li>\u003Cli>6862\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Normas nacionais\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>ArmSCII\u003C/li>\u003Cli>Grande.\u003C/li>\u003Cli>Braços\u003C/li>\u003Cli>CNS 11643\u003C/li>\u003Cli>DIN 66003\u003C/li>\u003Cli>ELE 927\u003C/li>\u003Cli>GOST 10859\u003C/li>\u003Cli>GB 2312\u003C/li>\u003Cli>GB 12345\u003C/li>\u003Cli>GB 12052\u003C/li>\u003Cli>GB 18030\u003C/li>\u003Cli>HKSCS\u003C/li>\u003Cli>ISCII\u003C/li>\u003Cli>JIS X 0201\u003C/li>\u003Cli>JIS X 0208\u003C/li>\u003Cli>JIS X 0212\u003C/li>\u003Cli>JIS X 0213\u003C/li>\u003Cli>KOI-7\u003C/li>\u003Cli>KPS 9566\u003C/li>\u003Cli>KS X 1001\u003C/li>\u003Cli>KS X 1002\u003C/li>\u003Cli>LST 1564\u003C/li>\u003Cli>LST 1590-4\u003C/li>\u003Cli>PASCAL\u003C/li>\u003Cli>Shift JIS\u003C/li>\u003Cli>SI 960\u003C/li>\u003Cli>TIS-620\u003C/li>\u003Cli>TSCII\u003C/li>\u003Cli>VISCAL\u003C/li>\u003Cli>VSCII\u003C/li>\u003Cli>YUSCII\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">ISO/IEC 2022\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>ISO/IEC 8859\u003C/li>\u003Cli>ISO/IEC 10367\u003C/li>\u003Cli>Código Unix estendido / EUC\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Mac OS Páginas de código\u003Cbr/>(\"scripts\")\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Arménio\u003C/li>\u003Cli>Árabe\u003C/li>\u003Cli>Barents Cyrillic\u003C/li>\u003Cli>Celta\u003C/li>\u003Cli>Central Europeu\u003C/li>\u003Cli>Croata\u003C/li>\u003Cli>Cyrillic\u003C/li>\u003Cli>Devanagari\u003C/li>\u003Cli>Farsi (Persa)\u003C/li>\u003Cli>Fonte X (Kermit)\u003C/li>\u003Cli>Gaélico\u003C/li>\u003Cli>Geórgia\u003C/li>\u003Cli>Grego\u003C/li>\u003Cli>Gujardo\u003C/li>\u003Cli>Produtos de plástico\u003C/li>\u003Cli>Hebraico\u003C/li>\u003Cli>Islândia\u003C/li>\u003Cli>Inútil\u003C/li>\u003Cli>Teclado\u003C/li>\u003Cli>Latim (Kermit)\u003C/li>\u003Cli>Maltese/Esperanto\u003C/li>\u003Cli>Ogham\u003C/li>\u003Cli>Romano\u003C/li>\u003Cli>Romeno\u003C/li>\u003Cli>Sámi\u003C/li>\u003Cli>Turco turco\u003C/li>\u003Cli>Cirílico Turco\u003C/li>\u003Cli>Ucrânia\u003C/li>\u003Cli>VT100\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">páginas de código DOS\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>437\u003C/li>\u003Cli>668\u003C/li>\u003Cli>708\u003C/li>\u003Cli>720\u003C/li>\u003Cli>737\u003C/li>\u003Cli>770\u003C/li>\u003Cli>773\u003C/li>\u003Cli>775\u003C/li>\u003Cli>776\u003C/li>\u003Cli>777\u003C/li>\u003Cli>778\u003C/li>\u003Cli>850\u003C/li>\u003Cli>851\u003C/li>\u003Cli>852\u003C/li>\u003Cli>853\u003C/li>\u003Cli>855\u003C/li>\u003Cli>856\u003C/li>\u003Cli>857\u003C/li>\u003Cli>858\u003C/li>\u003Cli>859\u003C/li>\u003Cli>860\u003C/li>\u003Cli>861\u003C/li>\u003Cli>862\u003C/li>\u003Cli>863\u003C/li>\u003Cli>864\u003C/li>\u003Cli>865\u003C/li>\u003Cli>866\u003C/li>\u003Cli>867\u003C/li>\u003Cli>868\u003C/li>\u003Cli>869\u003C/li>\u003Cli>897\u003C/li>\u003Cli>899\u003C/li>\u003Cli>903\u003C/li>\u003Cli>904\u003C/li>\u003Cli>932\u003C/li>\u003Cli>936\u003C/li>\u003Cli>942\u003C/li>\u003Cli>949\u003C/li>\u003Cli>950\u003C/li>\u003Cli>951\u003C/li>\u003Cli>1034\u003C/li>\u003Cli>1040\u003C/li>\u003Cli>1042\u003C/li>\u003Cli>1043\u003C/li>\u003Cli>1044\u003C/li>\u003Cli>1098\u003C/li>\u003Cli>1115\u003C/li>\u003Cli>1116\u003C/li>\u003Cli>1117\u003C/li>\u003Cli>1118\u003C/li>\u003Cli>1127\u003C/li>\u003Cli>3846\u003C/li>\u003Cli>ABICOMP\u003C/li>\u003Cli>CS Indic\u003C/li>\u003Cli>CSX Índio\u003C/li>\u003Cli>CSX+ Indic\u003C/li>\u003Cli>CWI-2\u003C/li>\u003Cli>Sistema do Irã\u003C/li>\u003Cli>Kamenicky\u003C/li>\u003Cli>Mazovia\u003C/li>\u003Cli>MIK\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Páginas de código IBM AIX\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>895\u003C/li>\u003Cli>896\u003C/li>\u003Cli>912\u003C/li>\u003Cli>915\u003C/li>\u003Cli>921\u003C/li>\u003Cli>92\u003C/li>\u003Cli>1006\u003C/li>\u003Cli>1008\u003C/li>\u003Cli>1009\u003C/li>\u003Cli>1010\u003C/li>\u003Cli>1012\u003C/li>\u003Cli>1013\u003C/li>\u003Cli>1014\u003C/li>\u003Cli>1015\u003C/li>\u003Cli>1016\u003C/li>\u003Cli>1017\u003C/li>\u003Cli>1018\u003C/li>\u003Cli>1019\u003C/li>\u003Cli>1046\u003C/li>\u003Cli>1124\u003C/li>\u003Cli>1133\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Páginas de código do Windows\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>CER-GS\u003C/li>\u003Cli>932\u003C/li>\u003Cli>936 (GBK)\u003C/li>\u003Cli>950\u003C/li>\u003Cli>1169\u003C/li>\u003Cli>Latim estendido... 8\u003C/li>\u003Cli>1250\u003C/li>\u003Cli>1251\u003C/li>\u003Cli>1252\u003C/li>\u003Cli>1253\u003C/li>\u003Cli>1254\u003C/li>\u003Cli>1255\u003C/li>\u003Cli>1256\u003C/li>\u003Cli>1257\u003C/li>\u003Cli>1258\u003C/li>\u003Cli>1270\u003C/li>\u003Cli>Cirílico + Finlandês\u003C/li>\u003Cli>Cirílico + Francês\u003C/li>\u003Cli>Cirílico + Alemão\u003C/li>\u003Cli>Grego politico\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Páginas de código EBCDIC\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Língua japonesa em EBCDIC\u003C/li>\u003Cli>DKOI\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Terminais DEC (VTx)\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Multinacional (MCS)\u003C/li>\u003Cli>Substituição Nacional (NRCS)\n\u003Cul>\u003Cli>Francês canadense\u003C/li>\u003Cli>Suíça\u003C/li>\u003Cli>Espanhol\u003C/li>\u003Cli>Reino Unido\u003C/li>\u003Cli>Países Baixos\u003C/li>\u003Cli>Finlândia\u003C/li>\u003Cli>Francês\u003C/li>\u003Cli>Norueguês e Dinamarquês\u003C/li>\u003Cli>Sueco\u003C/li>\u003Cli>Norueguês e Dinamarquês (alternativa)\u003C/li>\u003C/ul>\u003C/li>\u003Cli>8-bit grego\u003C/li>\u003Cli>Turco de 8 bits\u003C/li>\u003Cli>SI 960\u003C/li>\u003Cli>Hebraico\u003C/li>\u003Cli>Gráficos especiais\u003C/li>\u003Cli>Técnico (TCS)\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Plataforma específica\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>1052\u003C/li>\u003Cli>1053\u003C/li>\u003Cli>1054\u003C/li>\u003Cli>1055\u003C/li>\u003Cli>1056\u003C/li>\u003Cli>1057\u003C/li>\u003Cli>1058\u003C/li>\u003Cli>Acorn RISC OS\u003C/li>\u003Cli>CPC Amstrad\u003C/li>\u003Cli>Apple II\u003C/li>\u003Cli>ATASCII\u003C/li>\u003Cli>Atari ST\u003C/li>\u003Cli>BICS\u003C/li>\u003Cli>Cálcio calculadoras\u003C/li>\u003Cli>CDC\u003C/li>\u003Cli>Compucolor 8001\u003C/li>\u003Cli>Compucolor II\u003C/li>\u003Cli>CP/M+\u003C/li>\u003Cli>DEC RADIX 50\u003C/li>\u003Cli>DEC MCS/NRCS\u003C/li>\u003Cli>DG Internacional\u003C/li>\u003Cli>Festas de Aniversário\u003C/li>\u003Cli>GEM\u003C/li>\u003Cli>GSM 03.38\u003C/li>\u003Cli>HP Roman\u003C/li>\u003Cli>HP FOCAL\u003C/li>\u003Cli>HP RPL\u003C/li>\u003Cli>SQUOZE\u003C/li>\u003Cli>LICS\u003C/li>\u003Cli>LMBCS\u003C/li>\u003Cli>MSX\u003C/li>\u003Cli>NEC APC\u003C/li>\u003Cli>NeXT\u003C/li>\u003Cli>PETSCII\u003C/li>\u003Cli>Padrão PostScript\u003C/li>\u003Cli>PostScript Latin 1\u003C/li>\u003Cli>SAM Coupé\u003C/li>\u003Cli>Sega SC-3000\u003C/li>\u003Cli>Calculadoras afiadas\u003C/li>\u003Cli>Sharp MZ\u003C/li>\u003Cli>Sinclair QL\u003C/li>\u003Cli>Teletexto\u003C/li>\u003Cli>Calculadoras TI\u003C/li>\u003Cli>TRS-80\u003C/li>\u003Cli>Ventura Internacional\u003C/li>\u003Cli>WISCII\u003C/li>\u003Cli>XCCS\u003C/li>\u003Cli>ZX80\u003C/li>\u003Cli>ZX81\u003C/li>\u003Cli>Espectro de ZX\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Unicode / ISO/IEC 10646\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>UTF-1\u003C/li>\u003Cli>UTF-7\u003C/li>\u003Cli>UTF-8\u003C/li>\u003Cli>UTF-16\u003C/li>\u003Cli>UTF-32\u003C/li>\u003Cli>UTF-EBCDIC\u003C/li>\u003Cli>GB 18030\u003C/li>\u003Cli>DIN 91379\u003C/li>\u003Cli>BOCU-1\u003C/li>\u003Cli>CESÍ87\u003C/li>\u003Cli>SCSU\u003C/li>\u003Cli>TACE16\u003C/li>\u003Cli>Comparação de codificação Unicode\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Sistema de tipoção TeX\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Cortiça\u003C/li>\u003Cli>LY1\u003C/li>\u003Cli>OML\u003C/li>\u003Cli>OMS\u003C/li>\u003Cli>OT1\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Várias páginas de código\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>ABICOMP\u003C/li>\u003Cli>ASMO 449\u003C/li>\u003Cli>Codificação digital de símbolos APL\n\u003Cul>\u003Cli>ISO-IR-68\u003C/li>\u003C/ul>\u003C/li>\u003Cli>ARIB STD-B24\u003C/li>\u003Cli>Campo de batalha\u003C/li>\u003Cli>HZ\u003C/li>\u003Cli>IEC-P27-1\u003C/li>\u003Cli>INIS\n\u003Cul>\u003Cli>7 bits\u003C/li>\u003Cli>8 bits\u003C/li>\u003C/ul>\u003C/li>\u003Cli>ISO-IR-169\u003C/li>\u003Cli>ISO 2033\u003C/li>\u003Cli>KOI\n\u003Cul>\u003Cli>KOI8-R\u003C/li>\u003Cli>KOI8-RU\u003C/li>\u003Cli>KOI8-U\u003C/li>\u003C/ul>\u003C/li>\u003Cli>\u003Ci>Mojikyo\u003C/i>\u003C/li>\u003Cli>SEASCAL\u003C/li>\u003Cli>Stanford/ITS\u003C/li>\u003Cli>Símbolo\u003C/li>\u003Cli>TRONDE\u003C/li>\u003Cli>Código de suspensão unificado\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Característica de controle\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-even hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>Promissões de morse\u003C/li>\u003Cli>Códigos de controle C0 e C1\n\u003Cul>\u003Cli>ISO/IEC 6429\u003C/li>\u003Cli>JIS X 0211\u003C/li>\u003C/ul>\u003C/li>\u003Cli>Unicode control, formato e separador caracteres\u003C/li>\u003Cli>Personagens do Whitespace\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Cth class=\"navbox-group\" scope=\"row\" style=\"width:1%\">Temas relacionados\u003C/th>\u003Ctd class=\"navbox-list-with-group navbox-list navbox-odd hlist\" style=\"width:100%;padding:0\">\u003Cdiv style=\"padding:0 0.25em\">\u003Cul>\u003Cli>CCSID\u003C/li>\u003Cli>Codificações de caracteres em HTML\u003C/li>\u003Cli>Detecção de caracteres\u003C/li>\u003Cli>unificação de Han\u003C/li>\u003Cli>Página de código do hardware\u003C/li>\u003Cli>Código MICR\u003C/li>\u003Cli>Mojibake\u003C/li>\u003Cli>Codificação de comprimento variável\u003C/li>\u003C/ul>\u003C/div>\u003C/td>\u003C/tr>\u003Ctr>\u003Ctd class=\"navbox-abovebelow\" colspan=\"2\">\u003Cdiv>\u003Cspan class=\"noviewer\" typeof=\"mw:File\">\u003Cspan title=\"Category\">\u003Cimg alt=\"\" class=\"mw-file-element\" data-file-height=\"185\" data-file-width=\"180\" decoding=\"async\" height=\"16\" src=\"https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/16px-Symbol_category_class.svg.png\" srcset=\"https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/23px-Symbol_category_class.svg.png 1.5x, https://upload.wikimedia.org/wikipedia/en/thumb/9/96/Symbol_category_class.svg/31px-Symbol_category_class.svg.png 2x\" width=\"16\"/>\u003C/span>\u003C/span> Conjuntos de caracteres\u003C/div>\u003C/td>\u003C/tr>\u003C/tbody>\u003C/table>\u003C/div>",{"status":16},{"code":17,"debug":18},404,"fetching error",["Reactive",20],{},["Set"],["ShallowReactive",23],{"content":24,"related":24},null,true,"/enciclop%C3%A9dia/mojibake/"]</script> <script>window.__NUXT__={};window.__NUXT__.config={public:{},app:{baseURL:"/",buildId:"88f70622-6877-42fc-8c70-90a92a0acbdc",buildAssetsDir:"/_nuxt/",cdnURL:""}}</script> <script defer src="https://www.googletagmanager.com/gtag/js?id=G-3NVN9267P3"></script> <script>(async(e,t,a)=>{e[t]=async function(){(e[a]=e[a]||[]).push(arguments),e.dispatchEvent(new CustomEvent("layerUpdated",{detail:arguments}))},e[t]("js",new Date),e[t]("config","G-3NVN9267P3",{transport_type:"beacon"}),e.addEventListener("error",(a=>{e[t]("error",a),a.preventDefault()}))})(window,"gtag","dataLayer")</script></body></html>