ISO/CEI 8859
ISO/IEC 8859 es una serie conjunta de normas ISO e IEC para codificaciones de caracteres de 8 bits. La serie de normas consta de partes numeradas, como ISO/IEC 8859-1, ISO/IEC 8859-2, etc. Hay 15 partes, excluyendo la abandonada ISO/IEC 8859-12. El grupo de trabajo de ISO que mantiene esta serie de normas se ha disuelto.
ISO/IEC 8859 partes 1, 2, 3 y 4 eran originalmente el estándar internacional Ecma ECMA-94.
Introducción
Si bien los patrones de bits de los 95 caracteres ASCII imprimibles son suficientes para intercambiar información en inglés moderno, la mayoría de los otros idiomas que usan alfabetos latinos necesitan símbolos adicionales que no están cubiertos por ASCII. ISO/IEC 8859 buscó remediar este problema utilizando el octavo bit en un byte de 8 bits para permitir posiciones para otros 96 caracteres imprimibles. Las primeras codificaciones estaban limitadas a 7 bits debido a las restricciones de algunos protocolos de transmisión de datos y, en parte, por razones históricas. Sin embargo, se necesitaban más caracteres de los que podían caber en una sola codificación de caracteres de 8 bits, por lo que se desarrollaron varias asignaciones, incluidas al menos diez adecuadas para varios alfabetos latinos.
Las partes estándar ISO/IEC 8859 solo definen caracteres imprimibles, aunque separan explícitamente los rangos de bytes 0x00–1F y 0x7F–9F como "combinaciones que no representan caracteres gráficos" (es decir, que están reservados para su uso como caracteres de control) de acuerdo con ISO/IEC 4873; fueron diseñados para usarse junto con un estándar separado que define las funciones de control asociadas con estos bytes, como ISO 6429 o ISO 6630. Para este fin, una serie de codificaciones registradas con IANA agregan el conjunto de control C0 (caracteres de control asignados a bytes 0 a 31) de ISO 646 y el conjunto de control C1 (caracteres de control asignados a los bytes 128 a 159) de ISO 6429, lo que da como resultado mapas de caracteres completos de 8 bits con la mayoría, si no todos, los bytes asignados. Estos conjuntos tienen ISO-8859-n como su nombre MIME preferido o, en los casos en que no se especifica un nombre MIME preferido, su nombre canónico. Mucha gente usa los términos ISO/IEC 8859-n e ISO-8859-n indistintamente. A ISO/IEC 8859-11 no se le asignó dicho juego de caracteres, presumiblemente porque era casi idéntico a TIS 620.
Personajes
El estándar ISO/IEC 8859 está diseñado para el intercambio de información confiable, no para la tipografía; el estándar omite los símbolos necesarios para la tipografía de alta calidad, como ligaduras opcionales, comillas, guiones, etc. Como resultado, los sistemas de composición tipográfica de alta calidad a menudo usan extensiones propietarias o idiosincrásicas además de los estándares ASCII e ISO/IEC 8859, o use Unicode en su lugar.
Una regla inexacta basada en la experiencia práctica establece que si un carácter o símbolo no formaba ya parte de un conjunto de caracteres de procesamiento de datos ampliamente utilizado y tampoco se proporcionaba normalmente en los teclados de las máquinas de escribir para un idioma nacional, no entró. Por lo tanto, se incluyeron las comillas dobles direccionales « y » utilizadas para algunos idiomas europeos, pero no las comillas dobles direccionales “ y ” utilizado para inglés y algunos otros idiomas.
El francés no obtuvo sus ligaduras œ y Œ porque podían escribirse como 'oe'. Del mismo modo, Ÿ, necesario para el texto en mayúsculas, también se eliminó. Aunque con puntos de código diferentes, estos tres caracteres se reintrodujeron más tarde con ISO/IEC 8859-15 en 1999, que también introdujo el nuevo símbolo del euro €. Del mismo modo, el holandés no obtuvo las letras ij y IJ, porque los hablantes de holandés se habían acostumbrado a escribirlas como dos letras.
El rumano inicialmente no obtuvo sus letras Ș/ș y Ț/ț (con coma), porque estas letras se unificaron inicialmente con Ş/ş y Ţ/ţ (con cedilla) por el Consorcio Unicode, considerando las formas con coma debajo como variantes de glifo de las formas con cedilla. Sin embargo, las letras con comas explícitas a continuación se agregaron más tarde al estándar Unicode y también están en ISO/IEC 8859-16.
La mayoría de las codificaciones ISO/IEC 8859 proporcionan marcas diacríticas requeridas para varios idiomas europeos que utilizan la escritura latina. Otros proporcionan alfabetos no latinos: griego, cirílico, hebreo, árabe y tailandés. La mayoría de las codificaciones contienen solo caracteres de espaciado, aunque las tailandesas, hebreas y árabes también contienen caracteres combinados.
El estándar no contempla las escrituras de los idiomas de Asia oriental (CJK), ya que sus sistemas de escritura ideográfica requieren muchos miles de puntos de código. Aunque usa caracteres latinos, el vietnamita tampoco cabe en 96 posiciones (sin usar diacríticos combinados como en Windows-1258). Cada alfabeto silábico japonés (hiragana o katakana, véase Kana) cabría, como en JIS X 0201, pero como muchos otros alfabetos del mundo, no están codificados en el sistema ISO/IEC 8859.
Las partes de ISO/IEC 8859
ISO/IEC 8859 se divide en las siguientes partes:
Parte | Nombre | Revisiones | Otras normas | Descripción |
---|---|---|---|---|
Parte 1 | Latin-1 Europa occidental | 1987, 1998 | ECMA-94 (1985, 1986) | Tal vez la parte más utilizada de la ISO/IEC 8859, que abarca la mayoría de los idiomas de Europa occidental: danés (parcial), holandés (parcial), inglés, féroe, finlandés (partial), francés (partial), alemán, islandés, irlandés, italiano, noruego, portugués, roeto-romano, gaélico escocés, español, catalán y sueco. También se incluyen los idiomas de otras partes del mundo, como el albanés de Europa oriental, el sudeste asiático indonesio, así como los afrikaans y el swahili de África.
Una modificación de DEC MCS; la primera versión estándar (1985) a nivel de ECMA carecía de los tiempos de firma y división obelus, que se agregaron el próximo año. El signo del euro desaparecido y el capital . están en la versión revisada ISO/IEC 8859-15 (ver más abajo). El conjunto de caracteres IANA correspondiente es ISO-8859-1. |
Segunda parte | Latin-2 Europa central | 1987, 1999 | ECMA-94 (1986) | Apoya los idiomas de Europa central y oriental que utilizan el alfabeto latino, incluyendo bosnio, polaco, croata, checo, eslovaco, esloveno, serbio y húngaro. El signo del euro perdido se puede encontrar en la versión ISO/IEC 8859-16. |
Parte 3 | Latin-3 South European | 1988, 1999 | Turco, Maltés y Esperanto. Ampliamente superada por ISO/IEC 8859-9 para turco. | |
Parte 4 | Latin-4 North European | 1988, 1998 | Estonia, Letonia, Lituania, Groenlandia y Sami. | |
Parte 5 | Latin/Cyrillic | 1988, 1999 | ECMA-113 (1988, 1999) | Cubre principalmente idiomas eslavos que utilizan un alfabeto cirílico, incluyendo bielorruso, búlgaro, macedonio, ruso, serbio y ucraniano (parcial). |
Parte 6 | Latin/Arabic | 1987, 1999 |
| Cubre los caracteres más comunes del idioma árabe. No soporta otros idiomas usando el script árabe. Necesita ser BiDi y la unión cursiva procesada para mostrar. |
Parte 7 | Latin/Greek | 1987, 2003 |
| Cubre el lenguaje griego moderno (ortografía monotónica). También se puede utilizar para griego antiguo escrito sin acentos o en ortografía monotónica, pero carece de los diacríticos para la ortografía politónica. Estos fueron introducidos con Unicode. Actualizado 2003 para añadir el signo del euro, signo drachma y espaciamiento ypogegrammeni. |
Parte 8 | Latin/Hebrew | 1988, 1999 |
| Cubre el alfabeto hebreo moderno como se utiliza en Israel. En la práctica existen dos codificacións diferentes, orden lógico (necesidad de ser BiDi procesada para mostrar) y orden visual (izquierda a derecha) (en efecto, después del procesamiento bidi y la ruptura de líneas). Actualizado 1999 para añadir LRM y RLM. Actualizado a nivel nacional estándar en 2002 para añadir señales de euro y shekel y efectos de formato más bidireccional; las adiciones de 2002 nunca fueron incorporadas en la versión estándar ISO. |
Parte 9 | Latin-5 Turco | 1989, 1999 |
| En gran medida lo mismo que ISO/IEC 8859-1, reemplazando las cartas islandesas rara vez utilizadas por las turcas. |
Parte 10 | Latin-6 Nordic | 1992, 1998 | ECMA-144 (1990, 1992, 2000) | Una reorganización de latín-4. Considerado más útil para los idiomas nórdicos. Las lenguas bálticas usan latín-4 más. |
Parte 11 | Latin/Thai | 2001 | TIS-620 (1986, 1990) | Contiene caracteres necesarios para el idioma tailandés. First revision established in 1986 at national standard level as TIS 620. Elevated to ISO standard status as a part of ISO 8859 in 2001, with the addition of a non-breaking space. |
Latin/Devanagari | N/A | - | En 1997 se abandonó oficialmente el trabajo de 8859 para Devanagari. ISCII y Unicode/ISO/IEC 10646 cubren Devanagari. | |
Parte 13 | Latin-7 Báltico Rim | 1998 | - | Agregó algunos caracteres para las lenguas bálticas que faltaban de latín-4 y latín-6. Related to the earlier-published Windows-1257. |
Parte 14 | Latin-8 Celtic | 1998 | - | Cubre idiomas celtas como el gaélico y el bretón. Las letras galés corresponden al anterior (1994) ISO-IR-182. |
Parte 15 | Latin-9 | 1999 | - | Una revisión de 8859-1 que elimina algunos símbolos poco usados, sustituyéndolos con el signo del euro € y las cartas Š, š, Ž, ž, ., œ, y ., que completa la cobertura de francés, finlandés y estonio. |
Parte 16 | Latin-10 Europa sudoriental | 2001 | SR 14111 (1998) | Intended for Albanian, Croatian, Hungarian, Italian, Polish, Romanian and Slovene, but also Finnish, French, German and Irish Gaelic (new orthography). El enfoque se centra más en letras que símbolos. El signo de moneda es reemplazado por el signo del euro. |
Cada parte de ISO/IEC 8859 está diseñada para admitir idiomas que a menudo se toman prestados unos de otros, por lo que los caracteres que necesita cada idioma generalmente se acomodan en una sola parte. Sin embargo, hay algunos caracteres y combinaciones de idiomas que no se adaptan sin transcripciones. Se hicieron esfuerzos para que las conversiones fueran lo más fluidas posible. Por ejemplo, el alemán tiene todos sus siete caracteres especiales en las mismas posiciones en todas las variantes latinas (1–4, 9, 10, 13–16), y en muchas posiciones los caracteres solo difieren en los signos diacríticos entre los conjuntos. En particular, las variantes 1 a 4 se diseñaron conjuntamente y tienen la propiedad de que cada carácter codificado aparece en una posición determinada o no aparece en absoluto.
Mesa
Binary | Oct | Dec | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1010 0000 | 240 | 160 | A0 | Non-breaking space (NBSP) | |||||||||||||||
1010 0001 | 241 | 161 | A1 | ¡ | Ą | Ħ | Ą | Ё | ‘ | ¡ | Ą | ก | ” | Ḃ | ¡ | Ą | |||
1010 0010 | 242 | 162 | A2 | ¢ | ˘ | ĸ | Ђ | ’ | ¢ | ¢ | Ē | ข | ¢ | ḃ | ¢ | ą | |||
1010 0011 | 243 | 163 | A3 | £ | Ł | £ | Ŗ | Ѓ | £ | Ģ | ฃ | £ | Ł | ||||||
1010 0100 | 244 | 164 | A4 | ¤ | Є | ¤ | € | ¤ | Ī | ค | ¤ | Ċ | € | ||||||
1010 0101 | 245 | 165 | A5 | ¥ | Ľ | Ĩ | Ѕ | ₯ | ¥ | Ĩ | ฅ | „ | ċ | ¥ | „ | ||||
1010 0110 | 246 | 166 | A6 | ¦ | Ś | Ĥ | Ļ | І | ¦ | Ķ | ฆ | ¦ | Ḋ | Š | |||||
1010 0111 | 247 | 167 | A7 | § | Ї | § | ง | § | |||||||||||
1010 1000 | 250 | 168 | A8 | ¨ | Ј | ¨ | Ļ | จ | Ø | Ẁ | š | ||||||||
1010 1001 | 251 | 169 | A9 | © | Š | İ | Š | Љ | © | Đ | ฉ | © | |||||||
1010 1010 | 252 | 170 | AA | ª | Ş | Ē | Њ | ͺ | × | ª | Š | ช | Ŗ | Ẃ | ª | Ș | |||
1010 1011 | 253 | 171 | AB | « | Ť | Ğ | Ģ | Ћ | « | Ŧ | ซ | « | ḋ | « | |||||
1010 1100 | 254 | 172 | AC | ¬ | Ź | Ĵ | Ŧ | Ќ | ، | ¬ | Ž | ฌ | ¬ | Ỳ | ¬ | Ź | |||
1010 1101 | 255 | 173 | AD | Soft hyphen (SHY) | ญ | SHY | |||||||||||||
1010 1110 | 256 | 174 | AE | ® | Ž | Ž | Ў | ® | Ū | ฎ | ® | ź | |||||||
1010 1111 | 257 | 175 | AF | ¯ | Ż | ¯ | Џ | ― | ¯ | Ŋ | ฏ | Æ | Ÿ | ¯ | Ż | ||||
1011 0000 | 260 | 176 | B0 | ° | А | ° | ฐ | ° | Ḟ | ° | |||||||||
1011 0001 | 261 | 177 | B1 | ± | ą | ħ | ą | Б | ± | ą | ฑ | ± | ḟ | ± | |||||
1011 0010 | 262 | 178 | B2 | ² | ˛ | ² | ˛ | В | ² | ē | ฒ | ² | Ġ | ² | Č | ||||
1011 0011 | 263 | 179 | B3 | ³ | ł | ³ | ŗ | Г | ³ | ģ | ณ | ³ | ġ | ³ | ł | ||||
1011 0100 | 264 | 180 | B4 | ´ | Д | ΄ | ´ | ī | ด | “ | Ṁ | Ž | |||||||
1011 0101 | 265 | 181 | B5 | µ | ľ | µ | ĩ | Е | ΅ | µ | ĩ | ต | µ | ṁ | µ | ” | |||
1011 0110 | 266 | 182 | B6 | ¶ | ś | ĥ | ļ | Ж | Ά | ¶ | ķ | ถ | ¶ | ||||||
1011 0111 | 267 | 183 | B7 | · | ˇ | · | ˇ | З | · | ท | · | Ṗ | · | ||||||
1011 1000 | 270 | 184 | B8 | ¸ | И | Έ | ¸ | ļ | ธ | ø | ẁ | ž | |||||||
1011 1001 | 271 | 185 | B9 | ¹ | š | ı | š | Й | Ή | ¹ | đ | น | ¹ | ṗ | ¹ | č | |||
1011 1010 | 272 | 186 | BA | º | ş | ē | К | Ί | ÷ | º | š | บ | ŗ | ẃ | º | ș | |||
1011 1011 | 273 | 187 | BB | » | ť | ğ | ģ | Л | ؛ | » | ŧ | ป | » | Ṡ | » | ||||
1011 1100 | 274 | 188 | BC | ¼ | ź | ĵ | ŧ | М | Ό | ¼ | ž | ผ | ¼ | ỳ | Œ | ||||
1011 1101 | 275 | 189 | BD | ½ | ˝ | ½ | Ŋ | Н | ½ | ― | ฝ | ½ | Ẅ | œ | |||||
1011 1110 | 276 | 190 | BE | ¾ | ž | ž | О | Ύ | ¾ | ū | พ | ¾ | ẅ | Ÿ | |||||
1011 1111 | 277 | 191 | BF | ¿ | ż | ŋ | П | ؟ | Ώ | ¿ | ŋ | ฟ | æ | ṡ | ¿ | ż | |||
1100 0000 | 300 | 192 | C0 | À | Ŕ | À | Ā | Р | ΐ | À | Ā | ภ | Ą | À | |||||
1100 0001 | 301 | 193 | C1 | Á | С | ء | Α | Á | ม | Į | Á | ||||||||
1100 0010 | 302 | 194 | C2 | Â | Т | آ | Β | Â | ย | Ā | Â | ||||||||
1100 0011 | 303 | 195 | C3 | Ã | Ă | Ã | У | أ | Γ | Ã | ร | Ć | Ã | Ă | |||||
1100 0100 | 304 | 196 | C4 | Ä | Ф | ؤ | Δ | Ä | ฤ | Ä | |||||||||
1100 0101 | 305 | 197 | C5 | Å | Ĺ | Ċ | Å | Х | إ | Ε | Å | ล | Å | Ć | |||||
1100 0110 | 306 | 198 | C6 | Æ | Ć | Ĉ | Æ | Ц | ئ | Ζ | Æ | ฦ | Ę | Æ | |||||
1100 0111 | 307 | 199 | C7 | Ç | Į | Ч | ا | Η | Ç | Į | ว | Ē | Ç | ||||||
1100 1000 | 310 | 200 | C8 | È | Č | È | Č | Ш | ب | Θ | È | Č | ศ | Č | È | ||||
1100 1001 | 311 | 201 | C9 | É | Щ | ة | Ι | É | ษ | É | |||||||||
1100 1010 | 312 | 202 | CA | Ê | Ę | Ê | Ę | Ъ | ت | Κ | Ê | Ę | ส | Ź | Ê | ||||
1100 1011 | 313 | 203 | CB | Ë | Ы | ث | Λ | Ë | ห | Ė | Ë | ||||||||
1100 1100 | 314 | 204 | CC | Ì | Ě | Ì | Ė | Ь | ج | Μ | Ì | Ė | ฬ | Ģ | Ì | ||||
1100 1101 | 315 | 205 | CD | Í | Э | ح | Ν | Í | อ | Ķ | Í | ||||||||
1100 1110 | 316 | 206 | CE | Î | Ю | خ | Ξ | Î | ฮ | Ī | Î | ||||||||
1100 1111 | 317 | 207 | CF | Ï | Ď | Ï | Ī | Я | د | Ο | Ï | ฯ | Ļ | Ï | |||||
Binary | Oct | Dec | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
1101 0000 | 320 | 208 | D0 | Ð | Đ | Đ | а | ذ | Π | Ğ | Ð | ะ | Š | Ŵ | Ð | ||||
1101 0001 | 321 | 209 | D1 | Ñ | Ń | Ñ | Ņ | б | ر | Ρ | Ñ | Ņ | ั | Ń | Ñ | Ń | |||
1101 0010 | 322 | 210 | D2 | Ò | Ň | Ò | Ō | в | ز | Ò | Ō | า | Ņ | Ò | |||||
1101 0011 | 323 | 211 | D3 | Ó | Ķ | г | س | Σ | Ó | ำ | Ó | ||||||||
1101 0100 | 324 | 212 | D4 | Ô | д | ش | Τ | Ô | ิ | Ō | Ô | ||||||||
1101 0101 | 325 | 213 | D5 | Õ | Ő | Ġ | Õ | е | ص | Υ | Õ | ี | Ő | ||||||
1101 0110 | 326 | 214 | D6 | Ö | ж | ض | Φ | Ö | ึ | Ö | |||||||||
1101 0111 | 327 | 215 | D7 | × | з | ط | Χ | × | Ũ | ื | × | Ṫ | × | Ś | |||||
1101 1000 | 330 | 216 | D8 | Ø | Ř | Ĝ | Ø | и | ظ | Ψ | Ø | ุ | Ų | Ø | Ű | ||||
1101 1001 | 331 | 217 | D9 | Ù | Ů | Ù | Ų | й | ع | Ω | Ù | Ų | ู | Ł | Ù | ||||
1101 1010 | 332 | 218 | DA | Ú | к | غ | Ϊ | Ú | ฺ | Ś | Ú | ||||||||
1101 1011 | 333 | 219 | DB | Û | Ű | Û | л | Ϋ | Û | Ū | Û | ||||||||
1101 1100 | 334 | 220 | DC | Ü | м | ά | Ü | Ü | |||||||||||
1101 1101 | 335 | 221 | DD | Ý | Ŭ | Ũ | н | έ | İ | Ý | Ż | Ý | Ę | ||||||
1101 1110 | 336 | 222 | DE | Þ | Ţ | Ŝ | Ū | о | ή | Ş | Þ | Ž | Ŷ | Þ | Ț | ||||
1101 1111 | 337 | 223 | DF | ß | п | ί | ‗ | ß | ฿ | ß | |||||||||
1110 0000 | 340 | 224 | E0 | à | ŕ | à | ā | р | ـ | ΰ | א | à | ā | เ | ą | à | |||
1110 0001 | 341 | 225 | E1 | á | с | ف | α | ב | á | แ | į | á | |||||||
1110 0010 | 342 | 226 | E2 | â | т | ق | β | ג | â | โ | ā | â | |||||||
1110 0011 | 343 | 227 | E3 | ã | ă | ã | у | ك | γ | ד | ã | ใ | ć | ã | ă | ||||
1110 0100 | 344 | 228 | E4 | ä | ф | ل | δ | ה | ä | ไ | ä | ||||||||
1110 0101 | 345 | 229 | E5 | å | ĺ | ċ | å | х | م | ε | ו | å | ๅ | å | ć | ||||
1110 0110 | 346 | 230 | E6 | æ | ć | ĉ | æ | ц | ن | ζ | ז | æ | ๆ | ę | æ | ||||
1110 0111 | 347 | 231 | E7 | ç | į | ч | ه | η | ח | ç | į | ็ | ē | ç | |||||
1110 1000 | 350 | 232 | E8 | è | č | è | č | ш | و | θ | ט | è | č | ่ | č | è | |||
1110 1001 | 351 | 233 | E9 | é | щ | ى | ι | י | é | ้ | é | ||||||||
1110 1010 | 352 | 234 | EA | ê | ę | ê | ę | ъ | ي | κ | ך | ê | ę | ๊ | ź | ê | |||
1110 1011 | 353 | 235 | EB | ë | ы | ً | λ | כ | ë | ๋ | ė | ë | |||||||
1110 1100 | 354 | 236 | EC | ì | ě | ì | ė | ь | ٌ | μ | ל | ì | ė | ์ | ģ | ì | |||
1110 1101 | 355 | 237 | ED | í | э | ٍ | ν | ם | í | ํ | ķ | í | |||||||
1110 1110 | 356 | 238 | EE | î | ю | َ | ξ | מ | î | ๎ | ī | î | |||||||
1110 1111 | 357 | 239 | EF | ï | ď | ï | ī | я | ُ | ο | ן | ï | ๏ | ļ | ï | ||||
1111 0000 | 360 | 240 | F0 | ð | đ | đ | № | ِ | π | נ | ğ | ð | ๐ | š | ŵ | ð | đ | ||
1111 0001 | 361 | 241 | F1 | ñ | ń | ñ | ņ | ё | ّ | ρ | ס | ñ | ņ | ๑ | ń | ñ | ń | ||
1111 0010 | 362 | 242 | F2 | ò | ň | ò | ō | ђ | ْ | ς | ע | ò | ō | ๒ | ņ | ò | |||
1111 0011 | 363 | 243 | F3 | ó | ķ | ѓ | σ | ף | ó | ๓ | ó | ||||||||
1111 0100 | 364 | 244 | F4 | ô | є | τ | פ | ô | ๔ | ō | ô | ||||||||
1111 0101 | 365 | 245 | F5 | õ | ő | ġ | õ | ѕ | υ | ץ | õ | ๕ | ő | ||||||
1111 0110 | 366 | 246 | F6 | ö | і | φ | צ | ö | ๖ | ö | |||||||||
1111 0111 | 367 | 247 | F7 | ÷ | ї | χ | ק | ÷ | ũ | ๗ | ÷ | ṫ | ÷ | ś | |||||
1111 1000 | 370 | 248 | F8 | ø | ř | ĝ | ø | ј | ψ | ר | ø | ๘ | ų | ø | ű | ||||
1111 1001 | 371 | 249 | F9 | ù | ů | ù | ų | љ | ω | ש | ù | ų | ๙ | ł | ù | ||||
1111 1010 | 372 | 250 | FA | ú | њ | ϊ | ת | ú | ๚ | ś | ú | ||||||||
1111 1011 | 373 | 251 | FB | û | ű | û | ћ | ϋ | û | ๛ | ū | û | |||||||
1111 1100 | 374 | 252 | FC | ü | ќ | ό | ü | ü | |||||||||||
1111 1101 | 375 | 253 | FD | ý | ŭ | ũ | § | ύ | LRM | ı | ý | ż | ý | ę | |||||
1111 1110 | 376 | 254 | FE | þ | ţ | ŝ | ū | ў | ώ | RLM | ş | þ | ž | ŷ | þ | ț | |||
1111 1111 | 377 | 255 | FF | ÿ | ˙ | џ | ÿ | ĸ | ’ | ÿ | |||||||||
Binary | Oct | Dec | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 |
En la posición 0xA0 siempre está el espacio de no separación y 0xAD es principalmente el guión suave, que solo se muestra en los saltos de línea. Otros campos vacíos son sin asignar o el sistema utilizado no es capaz de mostrarlos.
Hay nuevas incorporaciones como ISO /IEC 8859-7:2003 y versiones ISO/IEC 8859-8:1999. LRM significa marca de izquierda a derecha (U+200E) y RLM significa marca de derecha a izquierda (U+200F).
Relación con Unicode y UCS
Desde 1991, el Consorcio Unicode ha estado trabajando con ISO e IEC para desarrollar el estándar Unicode e ISO/IEC 10646: el conjunto de caracteres universales (UCS) en conjunto. Las ediciones más recientes de ISO/IEC 8859 expresan caracteres en términos de sus nombres Unicode/UCS y la notación U+nnnn, lo que hace que cada parte de ISO/IEC 8859 sea un esquema de codificación de caracteres Unicode/UCS que asigna un subconjunto muy pequeño del UCS a bytes únicos de 8 bits. Los primeros 256 caracteres en Unicode y UCS son idénticos a los de ISO/IEC-8859-1 (Latin-1).
Los conjuntos de caracteres de un solo byte, incluidas las partes de ISO/IEC 8859 y sus derivados, fueron los preferidos a lo largo de la década de 1990, con la ventaja de estar bien establecidos y de implementarse más fácilmente en el software: la ecuación de un byte a un carácter es simple y adecuado para la mayoría de las aplicaciones de un solo idioma, y no hay caracteres combinados ni formas variantes. A medida que los sistemas operativos habilitados para Unicode se generalizaron, ISO/IEC 8859 y otras codificaciones heredadas se volvieron menos populares. Si bien los remanentes de ISO 8859 y los modelos de caracteres de un solo byte siguen arraigados en muchos sistemas operativos, lenguajes de programación, sistemas de almacenamiento de datos, aplicaciones de red, hardware de visualización y software de aplicaciones de usuario final, la mayoría de las aplicaciones informáticas modernas utilizan Unicode internamente y dependen de la conversión. tablas para mapear hacia y desde otras codificaciones, cuando sea necesario.
Estado actual
El estándar ISO/IEC 8859 fue mantenido por el Comité Técnico Conjunto 1 de ISO/IEC, Subcomité 2, Grupo de Trabajo 3 (ISO/IEC JTC 1/SC 2/WG 3). En junio de 2004, el WG 3 se disolvió y las funciones de mantenimiento se transfirieron al SC 2. El estándar no se está actualizando actualmente, ya que el único grupo de trabajo restante del Subcomité, el WG 2, se concentra en el desarrollo de Unicode Conjunto de caracteres codificados universales.
El estándar de codificación WHATWG, que especifica las codificaciones de caracteres permitidas en HTML5 que deben admitir los navegadores compatibles, incluye la mayor parte de ISO/IEC 8859, excepto las partes 1, 9 y 11, que en su lugar se interpretan como Windows-1252, Windows -1254 y Windows-874 respectivamente. Los autores de nuevas páginas y los diseñadores de nuevos protocolos deben utilizar UTF-8 en su lugar.
Contenido relacionado
IRQ
Impresora braille
Cuchillo de uso