ISO/CEI 646

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Normas internacionales para 7 bits ASCII y modificaciones nacionales

ISO/IEC 646 es un conjunto de normas ISO/IEC, descrito como Tecnología de la información: conjunto de caracteres codificados ISO de 7 bits para el intercambio de información y desarrollado en cooperación con ASCII al menos desde 1964. Desde su primera edición en 1967 ha especificado un código de caracteres de 7 bits del que se derivan varios estándares nacionales.

ISO/IEC 646 también fue ratificado por ECMA como ECMA-6. La primera versión de ECMA-6 se publicó en 1965, basada en el trabajo que el Comité Técnico TC1 de ECMA había llevado a cabo desde diciembre de 1960.

Los caracteres del conjunto de caracteres básico ISO/IEC 646 son caracteres invariantes. Dado que esa parte de ISO/IEC 646, que es el conjunto de caracteres invariable compartido por todos los países, especificó solo las letras utilizadas en el alfabeto latino básico de ISO, los países que utilizan letras adicionales necesarias para crear variantes nacionales de ISO /IEC 646 para poder utilizar sus scripts nativos. Dado que la transmisión y el almacenamiento de códigos de 8 bits no eran estándar en ese momento, los caracteres nacionales debían ajustarse a las restricciones de 7 bits, lo que significa que algunos caracteres que aparecen en ASCII no aparecen en otras variantes nacionales de ISO/ CEI 646.

Historia

Early ASCII (ASA X3.4:1963)

ISO/IEC 646 y su predecesor ASCII (ASA X3.4) respaldaron en gran medida la práctica existente con respecto a la codificación de caracteres en la industria de las telecomunicaciones.

US-ASCII, o ISO/IEC 646:US

Como ASCII no proporcionó una cantidad de caracteres necesarios para otros idiomas además del inglés, se crearon varias variantes nacionales que sustituyeron algunos caracteres menos utilizados por los necesarios. Debido a la incompatibilidad de las diversas variantes nacionales, se introdujo una versión de referencia internacional (IRV) de ISO/IEC 646, en un intento de al menos restringir el conjunto reemplazado a los mismos caracteres en todas las variantes. La versión original (ISO 646 IRV) difería de ASCII solo en ese punto de código 0x24, el signo de dólar de ASCII ($) fue reemplazado por el símbolo de moneda internacional (¤). La versión final de 1991 del código ISO/IEC 646:1991 también se conoce como ITU T.50, Alfabeto de referencia internacional o IRA, anteriormente Alfabeto internacional n.º 5 (IA5). Este estándar permite a los usuarios ejercitar los 12 caracteres variables (es decir, dos caracteres gráficos alternativos y 10 caracteres nacionales definidos). Entre estos ejercicios, ISO 646:1991 IRV (versión de referencia internacional) se define explícitamente y es idéntico a ASCII.

La serie de normas ISO/IEC 8859 que rigen las codificaciones de caracteres de 8 bits sustituyen a la norma internacional ISO/IEC 646 y sus variantes nacionales al proporcionar 96 caracteres adicionales con el bit adicional y, por lo tanto, evitar cualquier sustitución de códigos ASCII. El estándar ISO/IEC 10646, directamente relacionado con Unicode, reemplaza todos los conjuntos ISO 646 e ISO/IEC 8859 con un conjunto unificado de codificaciones de caracteres que utilizan un valor mayor de 21 bits.

ISO 646:JP

Un legado de ISO/IEC 646 es visible en Windows, donde en muchas regiones de Asia oriental, el carácter de barra invertida que se usa en los nombres de archivo se representa como ¥ u otros caracteres como ₩. A pesar del hecho de que un código diferente para ¥ estaba disponible incluso en la página de códigos 437 de la PC original de IBM, y un código de doble byte separado para ¥ está disponible en Shift JIS (aunque esto a menudo usa un mapeo alternativo), tanto El texto se creó con el código de barra invertida utilizado para ¥ (debido a que Shift_JIS se basa oficialmente en ISO 646: JP, aunque Microsoft lo mapea como ASCII) que incluso las fuentes modernas de Windows han considerado necesario representar el código de esa manera. Existe una situación similar con ₩ y EUC-KR. Otro legado es la existencia de trigraphs en el lenguaje de programación C.

Estándares publicados

  • ISO/R646-1967
  • ISO 646:1972
  • ISO 646:1983
  • ISO/IEC 646:1991
  • ECMA-6 (1965-04-30), primera edición
  • ECMA-6 (1967-06), segunda edición
  • ECMA-6 (1970-07), tercera edición
  • ECMA-6 (1973-08), cuarta edición
  • ECMA-6 (1984-12, 1985-03), quinta edición
  • ECMA-6 (1991-12, 1997-08), sexta edición

Diseño de página de códigos

La siguiente tabla muestra el conjunto de caracteres invariantes ISO/IEC 646. Cada carácter se muestra con su equivalente Unicode. Los puntos de código nacional son grises con el carácter ASCII que se reemplaza. El amarillo indica un carácter que, en algunas regiones, podría combinarse con un carácter anterior como diacrítico utilizando el carácter de retroceso, lo que puede afectar la elección del glifo.

Además de las restricciones de conjuntos invariantes, 0x23 está restringido para ser # o £ y 0x24 está restringido para ser $ o ¤ en ECMA-6:1991, equivalente a ISO/IEC 646:1991. Sin embargo, estas restricciones no son seguidas por todas las variantes nacionales.

ISO/IEC 646(-INV)
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC SM SG RS EE.UU.
2x SP ! " # $ % " ' () ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; . = ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ ] ^ ¿Qué?
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x Sí. z {} Silencio } ~ DEL

Familias de codificación relacionadas

Conjunto de caracteres de reemplazo nacional

El Conjunto Nacional de Caracteres de Reemplazo (NRCS) es una familia de codificaciones de 7 bits introducida en 1983 por DEC con la serie de terminales de computadora VT200. Está estrechamente relacionado con ISO/IEC 646, ya que se basa en un subconjunto invariable similar de ASCII, que se diferencia en conservar $ como invariable pero no _ (aunque la mayoría de las variantes de NRCS conservan el _, y por lo tanto cumplir con el conjunto invariable ISO/IEC 646). La mayoría de las variantes de NRCS están estrechamente relacionadas con las variantes nacionales ISO/IEC 646 correspondientes donde existen, con la excepción de la variante holandesa.

Teletexto del Sistema Mundial

El estándar europeo de telecomunicaciones ETS 300 706, "Especificación de teletexto mejorada", define conjuntos de códigos latinos, griegos, cirílicos, árabes y hebreos con varias variantes nacionales tanto para el latín como para el cirílico. Al igual que NRCS e ISO/IEC 646, dentro de las variantes latinas, la familia de codificaciones conocida como conjunto G0 se basa en un subconjunto invariable similar de ASCII, pero no retiene ni $ ni _ como invariante. A diferencia de NRCS, las variantes a menudo difieren considerablemente de las correspondientes variantes nacionales ISO/IEC 646.

HP

HP tiene la página de códigos 1054, que agrega el tono medio (▒, U+2592) en 0x7F. La página de códigos 1052 reemplaza algunos caracteres ASCII de la página de códigos 1054.

Códigos y descripciones de variantes

ISO/IEC 646 variantes nacionales

Algunas variantes nacionales de ISO/IEC 646 son las siguientes:

Código ISO-IR ISO/IEC ESC Aprobado National Standard Descripción
CA 121 ESC 2/8 7/7 ISO 646 CSA Z243.4-1985-1 Canadá (No 1 alternativa, con "î")
(francés, clásico) (página del proyecto 1020)
CA2 122 ESC 2/8 7/8 ISO 646 CSA Z243.4-1985-2 Canadá (No 2 alternativa, con "É")
(francés, ortografía reformada)
CN 57 ESC 2/8 5/4 ? GB/T 1988-80 República Popular China (Latín básico)
CU 151 ESC 2/8 2/1 4/1 ISO 646 NC 99-10:81 / NC NC00-10:81 Cuba (español)
DANO 9-1 ESC 2/8 4/5 ¿SIS? NATS-DANO Noruega y Dinamarca (textos periodísticos). Punto de código invariable 0x22 se muestra como «, (compare " en el IRV). Sin embargo, todavía se considera una doble cita. Acompaña SEFI (NATS-SEFI).
DE 21 ESC 2/8 4/11 ISO 646 DIN 66003 Alemania (alemán) (página 1011, 20106)
DK ? DS 2089 Dinamarca (Danish) (Code page 1017)
ES 17 ESC 2/8 5/10 ECMA Olivetti Español (internacional) (página 1023)
ES2 85 ESC 2/8 6/8 ECMA IBM España (Basque, castellano, catalán, gallego) (Code page 1014)
FI 10 ISO 646 SFS 4017 Finlandia (versión básica) (página del proyecto 1018)
FR 69 ESC 2/8 6/6 ISO 646 AFNOR NF Z 62010-1982 Francia (francés) (página web, 1010)
FR1 25 ESC 2/8 5/2 ISO 646 AFNOR NF Z 62010-1973 Francia (obsoleto desde abril de 1985) (página 110 del Consejo)
GB 4 ESC 2/8 4/1 ISO 646 BS 4730 Reino Unido (en inglés) (página 1013)
HU 86 ESC 2/8 6/9 ISO 646 MSZ 7795/3 Hungría (Hungría)
IE 207 ? NSAI 433:1996 Irlanda (Irish)
INV 170 ESC 2/8 2/1 4/2 ISO 646 ISO 646:1983 Subconjunto invariable
(IRV) 2 ESC 2/8 4/0 ISO 646 ISO 646:1973 Versión de referencia internacional. 0x7E como un overline (ISO-IR-002).
? ? ISO 646 ISO 646:1983 Versión de referencia internacional. 0x7E como tilde (Code page 1009, 20105).
ISO 646:1991 La versión de referencia internacional coincide con la variante estadounidense (ver abajo).
ES ? ? ? Islandia (Islandia)
IT 15 ESC 2/8 5/9 ECMA UNI 0204-70 / Olivetti? Italiano (Code page 1012)
JP 14 ESC 2/8 4/10 ISO 646 JIS C 6220:1969-ro Japón (Romaji) (página 895). También se utiliza como código de 8 bits con el correspondiente conjunto complementario Katakana.
JP-OCR-B 92 ESC 2/8 6/14 ISO 646 JIS C 6229-1984- b Japón (OCR-B)
KR ? KS C 5636-1989 Corea del Sur
MT ? ? Malta (Maltesa, inglés)
NL ECMA IBM Países Bajos (Dutch) (página 1019)
NO 60 ESC 2/8 6/0 ISO 646 NS 4551 versión 1 Noruega (página 1016)
NO2 61 ESC 2/8 6/1 ISO 646 NS 4551 versión 2 Noruega (obsoleto desde junio de 1987) (página del proyecto 20108)
pl BN-74/3101-01 Polonia (Polish tiene 18 letras con marcas diacríticas, pero sólo 9 letras minúsculas se normalizan debido a razones de espacio de código).
PT 16 ESC 2/8 4/12 ECMA Olivetti Portugués (internacional)
PT2 84 ESC 2/8 6/7 ECMA IBM Portugal (Portugués, español) (página 1015)
SE 10 ESC 2/8 4/7 ISO 646 SEN 850200 Annex B, SIS 63 61 27 Suecia (Sueco básico) (página 1018, D47)
SE2 11 ESC 2/8 4/8 ISO 646 SEN 850200 Annex C, SIS 63 61 27 Suecia (extended Swedish for names) (Code page 20107, E47)
SEFI 8-1 ESC 2/8 4/3 SIS NATS-SEFI Suecia y Finlandia (textos periodísticos). Acompaña DANO (NATS-DANO).
T.61-7bit 102 ESC 2/8 7/5 ? Recomendación ITU/CCITT T.61 International (Teletex). También se utiliza con el conjunto complementario correspondiente como un código de 8 bits.
TW ? CNS 5205-1996 República de China (Taiwan)
US / (IRV) 6 ESC 2/8 4/2 ISO 646 ANSI X3.4-1968 e ISO 646:1983 (también IRV en ISO/IEC 646:1991) Estados Unidos (ASCII, Code page 367, 20127)
YU 141 ESC 2/8 7/10 ISO 646 JUS I.B1.002 (YUSCII) ex Yugoslavia (croata, esloveno, serbio, bosnio)
INIS49 ESC 2/8 5/7 OIEA INIS Subconjunto IRV ISO 646

Derivados nacionales

También existen algunos conjuntos de caracteres nacionales que se basan en ISO/IEC 646 pero que no siguen estrictamente su conjunto invariable (ver también § Derivados para otros alfabetos):

Conjunto de caracteres ISO-IR ISO ESC Aprobado National Standard Descripción
BS_viewdata 47 ESC 2/8 5/6 British Post Office Viewdata y Teletext. El cuadrado de Viewdata (⌗) sustituyó por el subrayado normalmente invariante (_) que no se puede mostrar en el hardware de destino. Esta es la codificación del WST_Engl de Microsoft.
GR / greek7 88 ESC 2/8 6/10 ? HOS ELOT 927 Grecia (retirada en noviembre de 1986). Usa las letras griegas en lugar de las romanas y por lo tanto no está hablando estrictamente una variante ISO 646.
greek7old 18 ESC 2/8 5/11 ECMA ? Conjunto gráfico griego. Similar en concepto a greek7, pero utiliza una asignación diferente de cartas. Además, el caso superior sigue el caso inferior.
Latin-Greek 19 ESC 2/8 5/12 ECMA ? Gráficos combinados latino-griego (sólo las capitales). Follows greek7old, pero incluye capitales latinos sin modificaciones, y capitales griegos sobre el caso latino inferior.
Latin-Greek-1 27 ESC 2/8 5/5 ECMA Honeywell-Bull Gráficos mixtos latino-griegos (sólo las capitales griegas). Visualmente unifica capitales griegos con capitales latinos cuando sea posible, y añade las capitales griegas restantes. A diferencia de las otras versiones griegas, todas las letras latinas básicas permanecen intactas. Reemplaza la punción invariable, así como caracteres nacionales, sin embargo, y por lo tanto no está hablando estrictamente una variante ISO 646.
Swi ECMA Olivetti Suiza (francés, alemán) (página 1021) Punto de código invariable 0x5F se cambia desde _ a è. Es una variante DEC NRCS, estrechamente relacionada con ISO 646, pero carece de un equivalente compatible con ISO 646.

Personajes de control

Todas las variantes enumeradas anteriormente son únicamente juegos de caracteres gráficos y se deben usar con un juego de caracteres de control C0 como se muestra en la siguiente tabla:

ISO-IR ISO ESC Aprobado Descripción
1 ESC 2/1 4/0 ISO 646 Controles ISO 646 ("controles ASCII")
7 ESC 2/1 4/1 ISO 646 Controles del periódico escandinavo (NATS)
26 ESC 2/1 4/3 ISO 646 Controles IPTC

Conjuntos de caracteres complementarios asociados

La siguiente tabla enumera conjuntos de caracteres gráficos complementarios definidos por el mismo estándar como variantes específicas de ISO/IEC 646. Éstos se seleccionarían mediante un mecanismo como el cambio hacia fuera o el supercambio NATS (cambio único), o configurando el octavo bit en entornos en los que hubiera uno disponible:

ISO-IR ISO/IEC ESC National Standard Descripción
8-2 ESC 2/8 4/4 NATS-SEFI-ADD Código suplementario utilizado con NATS-SEFI.
9-2 ESC 2/8 4/6 NATS-DANO-ADD Código suplementario utilizado con NATS-DANO.
13 ESC 2/8 4/9 JIS C 6220:1969-jp Katakana, utilizado como código complementario con ISO-646-JP.
103 ESC 2/8 7/6 ITU/CCITT T.61 Recomendación, Conjunto suplementario Código suplementario utilizado con T.61.

Cuadro de comparación de variantes

Los detalles de los cambios para algunas de estas variantes se proporcionan en la siguiente tabla. No se muestran las asignaciones de caracteres sin cambios en todas las variantes enumeradas (es decir, que siguen siendo las mismas que ASCII).

Para facilitar la comparación, las variantes detalladas incluyen variantes nacionales de ISO/IEC 646, la serie de juego de caracteres de reemplazo nacional (NRCS) estrechamente relacionada de DEC utilizada en terminales VT200, la serie de codificación de teletexto del sistema mundial europeo relacionada definida en ETS 300 706 y algunas otras codificaciones estrechamente relacionadas basadas en ISO/IEC 646. Los gráficos de códigos individuales están vinculados desde la segunda columna. Las celdas con fondo no blanco enfatizan las diferencias con US-ASCII (también el subconjunto de latín básico de ISO/IEC 10646 y Unicode).

Se pueden usar varios caracteres como combinación de caracteres, cuando van precedidos o seguidos de un control C0 de retroceso. Así lo atestiguan las tablas de códigos para IRV, GB, FR1, CA y CA2, en las que se advierte que "',^ se comportaría como la diéresis, acento agudo, cedilla y circunflejo (en lugar de comillas, una coma y una punta de flecha hacia arriba) cuando va precedido o seguido de un retroceso. El carácter de tilde (~) se introdujo de manera similar como diacrítico (˜). Este método de codificación se originó en la era de las máquinas de escribir/teletipos, cuando el uso de la tecla de retroceso superaba un glifo y puede considerarse obsoleto.

Más tarde, cuando los conjuntos de caracteres más amplios ganaron más aceptación, ISO/IEC 8859, los conjuntos de caracteres específicos del proveedor y, finalmente, Unicode se convirtieron en los métodos preferidos para codificar la mayoría de estas variantes.

Código de variación Code Chart Características de cada conjunto de charcos compatibles o derivados ISO 646 / NRCS
US / IRV (1991) ISO-IR-006 ! " # $ " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ~
Versiones de referencia internacionales más antiguas
IRV (1973) ISO-IR-002 ! " # # " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ̅
IRV (1983) CP01009 ! " # # " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ~
Invariantes y otros subconjuntos IRV
INV ISO-IR-170 ! " " : ? ¿Qué?
INV (NRCS) -... ! " $ " : ?
INV (Teletext) ETS WST ! " " : ?
INIS Subset ISO-IR-049 $ : [ ] Silencio
T.61 ISO-IR-102 ! " # # " : ? @ [ ] ¿Qué? Silencio
Asia oriental
JP ISO-IR-014 ! " # $ " : ? @ [ . ] ^ ¿Qué? ` {} Silencio } ̅
JP-OCR-B ISO-IR-092 ! " # $ " : ? @ [ . ] ^ ¿Qué? {} Silencio }
KR (KS X 1003) ! " # $ " : ? @ [ , ] ^ ¿Qué? ` {} Silencio } ̅
CN ISO-IR-057 ! " # . " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ̅
TW (CNS 5205) ! " # $ " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ̅
British and Irish
GB ISO-IR-004 ! " £ $ " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ̅
GB (NRCS) CP01101 ! " £ $ " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ~
Viewdata ISO-IR-047 ! " £ $ " : ? @ 1⁄2 , 1⁄4 . 3⁄4 .
IE ISO-IR-207 ! " £ $ " : ? Ó É Í Ú Á ¿Qué? ó é í ú A
Italofono o Francofono
IT ISO-IR-015 ! " £ $ " : ? § ° ç é ^ ¿Qué? ù a # è .
IT (Teletexto) ETS WST ! " £ $ " : ? é ° ç ù a # è .
FR (1983) ISO-IR-069 ! " £ $ " : ? a ° ç § ^ ¿Qué? μ é ù è .
FR (1973) ISO-IR-025 ! " £ $ " : ? a ° ç § ^ ¿Qué? ` é ù è .
FR Teletext ETS WST ! " é ï " : ? a ë ê ù î è ô û ç
CA ISO-IR-121 ! " # $ " : ? a ç ê î ¿Qué? ô é ù è û
CA2 ISO-IR-122 ! " # $ " : ? a ç ê É ¿Qué? ô é ù è û
Francophone-Alemania
swi (NRCS) CP01021 ! " ù $ " : ? a é ç ê î è ô ä . ü û
Germanophone
DE ISO-IR-021 ! " # $ " : ? § Ä Ö Ü ^ ¿Qué? ` ä . ü ß
Nordic (Eastern) and Baltic
FI / SE ISO-IR-010 ! " # # " : ? @ Ä Ö Å ^ ¿Qué? ` ä . å ̅
SE2 ISO-IR-011 ! " # # " : ? É Ä Ö Å Ü ¿Qué? é ä . å ü
SE (NRCS) CP01106 ! " # $ " : ? É Ä Ö Å Ü ¿Qué? é ä . å ü
FI (NRCS) CP01103 ! " # $ " : ? @ Ä Ö Å Ü ¿Qué? é ä . å ü
SEFI (NATS) ISO-IR-008-1 ! " # $ " : ?  Ä Ö Å ¿Qué? ä . å
EE (Teletexto) ETS WST ! " # õ " : ? Š Ä Ö Ž Ü . š ä . ž ü
LV / LT (Teletexto) ETS WST ! " # $ " : ? Š ė ę Ž č ū š ą ž .
Nordic (Western)
DK CP01017 ! " # # " : ? @ . Ø Å Ü ¿Qué? ` æ ø å ü
DK/NO (NRCS) CP01105 ! " # $ " : ? Ä . Ø Å Ü ¿Qué? ä æ ø å ü
DK/NO-alt (NRCS) CP01107 ! " # $ " : ? @ . Ø Å ^ ¿Qué? ` æ ø å ~
NO ISO-IR-060 ! " # $ " : ? @ . Ø Å ^ ¿Qué? ` æ ø å ̅
NO2 ISO-IR-061 ! " § $ " : ? @ . Ø Å ^ ¿Qué? ` æ ø å Silencio
DANO (NATS) ISO-IR-009-1 ! « » $ " : ?  . Ø Å ¿Qué? æ ø å
ES ! " # # " : ? . . . Ö ¿Qué? ð . Silencio æ .
Hispanophone
ES ISO-IR-017 ! " £ $ " : ? § ¡No! Ñ ¿Qué? ^ ¿Qué? ` ° ñ ç ~
ES2 ISO-IR-085 ! " # $ " : ? · ¡No! Ñ Ç ¿Qué? ¿Qué? ` ́ ñ ç .
CU ISO-IR-151 ! " # # " : ? @ ¡No! Ñ ] ¿Qué? ¿Qué? ` ́ ñ [ .
Hispanophone-Lusophone
ES/PT Teletext ETS WST ! " ç $ " : ? ¡No! A é í ó ú ¿Qué? ü ñ è a
Lusophone
PT ISO-IR-016 ! " # $ " : ? § Ã Ç . ^ ¿Qué? ` . ç õ °
PT2 ISO-IR-084 ! " # $ " : ? ́ Ã Ç . ^ ¿Qué? ` . ç õ ~
PT (NRCS) -... ! " # $ " : ? @ Ã Ç . ^ ¿Qué? ` . ç õ ~
Griego
Latin-GR mixed ISO-IR-027 Ξ " . # " Ψ Δ Ω . CCPR . ` {} Silencio } ̅
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 e ISO-IR-019 reemplazan letras romanas con letras griegas y se detallan en un gráfico separado.
Eslavo (escritura latina)
YU ISO-IR-141 ! " # $ " : ? Ž Š Đ Ć Č ¿Qué? ž š đ ć č
YU Teletext ETS WST ! " # . " : ? Č Ć Ž Đ Š ë č ć ž đ š
YU-alt Teletext ETS WST ! " # $ " : ? Č Ć Ž Đ Š ë č ć ž đ š
CS/CZ/SK (Teletext) ETS WST ! " # ů " : ? č . ž . í ř é A ě ú š
PL BN-74/3101-01 ! " # " : ? ę ź ń ś ¿Qué? ą ó ł ż ć
PL Teletext ETS WST ! " # ń " : ? ą Ƶ Ś Ł ć ó ę ż ś ł ź
Adaptaciones para el script cirílico reemplazan las letras romanas y se detallan en un gráfico separado
Otros
NL CP01019 ! " # $ " : ? @ [ ] ^ ¿Qué? ` {} Silencio } ̅
NL NRCS CP01102 ! " £ $ " : ? 3⁄4 ij 1⁄2 Silencio ^ ¿Qué? ` . . 1⁄4 ́
HU ISO-IR-086 ! " # # " : ? Á É Ö Ü ^ ¿Qué? A é . ü Español
MT ! " # $ " : ? @ ż ^ ¿Qué? . . Ż . .
RO (Teletext) ETS WST ! " # # " : ? . # Ş . Î ı ţ ş ă î
TR (Teletext) ETS WST ! " TL ğ " : ? . Ş Ö Ç Ü ı ş . ç ü
  1. ^ a b c Es un subconjunto de una de las Versiones Internacionales de Referencia de ISO 646, pero no incluye todos los caracteres presentes en el conjunto invariante. Incluido para comparación.
  2. ^ También UK Teletext.
  3. ^ a b c d e f h i j k l m n No se ajusta completamente al conjunto invariante, pero es un derivado estrechamente relacionado con ISO 646. Incluido aquí para la comparación.
  4. ^ a b c d e Variante ISO 646 idéntica a la variante NRCS.
  5. ^ También World System Teletext (DE)
  6. ^ También World System Teletext (SE/FI/HU)
  7. ^ a b Los charsets NATS (por ejemplo, NATS-SEFI) reemplazan @ (0x40) y ` (0x60) con "Unit space A" (UA) y "Unit space B" (UB). El espacio simple (0x20) se expande en la justificación. UA y UB son para anchos fijos, UA debe ser al menos tan ancho como UB. RFC 1345 mapas UA y UB a ISO 10646 (UCS) puntos de código U+E002 y U+E003, ambos en el Área de Uso Privado, respectivamente (aunque también enumera mapas PUA para varios otros caracteres que ahora tienen puntos de código UCS). Unicode contiene una serie de caracteres espaciales que pueden corresponder aproximadamente.
  8. ^ Conformance to the ISO 646 invariant set is questionable, but it is a closely related derivative of ISO 646. Incluido aquí para la comparación.

Derivados de otros alfabetos

Algunos conjuntos de caracteres de 7 bits para alfabetos no latinos se derivan del estándar ISO/IEC 646: estos no constituyen en sí mismos ISO/IEC 646 debido a que no siguen sus puntos de código invariantes (a menudo reemplazan las letras de al menos un caso), debido a la compatibilidad con diferentes alfabetos para los que el conjunto de puntos de código nacionales proporciona un espacio de codificación insuficiente. Ejemplos incluyen:

  • Turkmen de 7 bits (ISO-IR-230).
  • Griego de 7 bits.
    • En ELOT 927 (ISO-IR-088), el alfabeto griego se mapea en orden alfabético (excepto para el último-sigma) a las posiciones 0x61–0x71 y 0x73–0x79, en la parte superior de las letras minúsculas latinas.
    • ISO-IR-018 mapea el alfabeto griego sobre ambos casos de letra utilizando un esquema diferente (no en orden alfabético, pero tratando de igualar las letras griegas sobre las letras romanas que corresponden en algún sentido), y ISO-IR-019 mapea el alfabeto griego de la mayúscula latina utilizando el mismo esquema que ISO-IR-018.
    • La mitad inferior de la codificación de caracteres de letra Symbol utiliza su propio esquema para mapear letras griegas de ambos casos sobre las letras romanas ASCII, también tratando de mapear letras griegas sobre letras romanas que corresponden en algún sentido, pero tomando decisiones diferentes en este sentido (ver gráfico abajo). También reemplaza los puntos de código invariantes 0x22 y 0x27 y cinco puntos de código nacional con símbolos matemáticos. Aunque no se pretende utilizar en la prosa griega de tipografía, a veces se utiliza para ese propósito.
    • ISO-IR-027 (detallado en el gráfico anterior en lugar de abajo) incluye el alfabeto latino sin cambios, pero añade algunas letras mayúsculas griegas que no pueden ser representadas con homoglyphs de latín; mientras que se basa explícitamente en ISO/IEC 646, algunas de ellas se mapean a puntos de código invariantes en ISO/IEC 646 (0x21, 0x3A y 0x3F), y por tanto ISO/IEC no es verdadera
    • El sistema mundial Teletexto de codificación para usos griegos otro esquema de mapeo de letras griegas en orden alfabético sobre las letras ASCII de ambos casos, incluyendo varias letras con diacrítica.
  • Cirílico de 7 bits
    • KOI-7 o Short KOI, usado para ruso. Los caracteres cirílicos se asignan a las posiciones 0x60–0x7E, en la parte superior de las letras minúsculas latinas, coincidiendo con las letras homólogas cuando sea posible (donde в se mapea a w, no v). Superada por las variantes KOI-8.
    • SRPSCII y MAKSCII, variantes cirílicas de YUSCII (la variante latina es YU/ISO-IR-141 en el gráfico anterior), utilizada para serbio y macedonio respectivamente. Muy homologosa a la variante latina de YUSCII (siguiendo las reglas de la digraphia serbia), excepto por Љ (lj), ü (nj), Џ (dž) y ѕ (dz), que corresponden a los digraphs en ortografía latina, y se mapean sobre letras que no se utilizan en serbio o macedonio (q, w, x, y).
    • El G0 establece para las codificacións de Teletexto del Sistema Mundial para uso ruso/bulgariano y ucraniano G0 conjuntos similares a KOI-7 con algunas modificaciones. El G0 correspondiente para el Cirílico Serbio utiliza un esquema basado en la codificación Teletexto para serbio-croata y esloveno, en lugar de la YUSCII significativamente diferente.
  • Hebreo de 7 bits, SI 960. El alfabeto hebreo se asigna a las posiciones 0x60–0x7A, en la parte superior de la minúscula letras latinas (y acento grave para el aleph). Hebreo de 7 bits siempre fue almacenado en orden visual. Esta asignación con el conjunto de bits alto, es decir, con las letras hebreas en 0xE0-0xFA, es ISO/IEC 8859-8. El sistema mundial Teletexto de codificación para hebreo utiliza las mismas cartografías, pero utiliza BS_Viewdata como su codificación base (aunque SI 960 utiliza US-ASCII) e incluye un signo de shekel en 0x7B.
  • 7-bit árabe, ASMO 449 (ISO-IR-089). El alfabeto árabe se asigna a las posiciones 0x41–0x5A y 0x60–0x6A, en la parte superior de las letras latinas y minúsculas.

A continuación se muestra una comparación de algunas de estas codificaciones. Solo se muestra un caso, excepto en los casos en que los casos se asignan a letras diferentes. En tales casos, la asignación con el código más pequeño se muestra primero. Se dan posibles transcripciones para algunas cartas; donde se omite, se puede considerar que la letra corresponde a la romana sobre la que se mapea.

Inglés
(ASCII)
Alfabetos cirílicosAlfabeto griegoHebreo
Semi-transliterative Orden natural
Ruso
(KOI-7)
Ruso,
búlgaro
(WSTRU/BG)
Ucrania
(WST UKR)
Serbio
(SRPSCII)
Macedonia
(MAKSCII)
Serbio,
Macedonia
(WST SRP)
Griego
(Símbolo)
Griego
(IR-18)
Griego
(ELOT 927)
Griego
(WST EL)
Hebreo
(SI 960)
@
`
ш (ju/yu)ш (ju/yu)ш (ju/yu)vertido (Z)vertido (Z)Ч (č).
̅
́
`
@
`
ΐ
ENT
א (dadas/ llevadas)
AАА (a/á)ААААAAAA(b)
BББББББ....g)
C(c/ts)(c/ts)(c/ts)(c/ts)(c/ts)(c/ts)(ch/kh)Ψ (ps)(g)(g)d)
DДДДДДДΔΔΔΔh)
E(je/ye)(je/ye)e)e)e)e)....(w)
FФФФФФФGoverning (ph/f)Governing (ph/f)(z)(z)z)
GГГГГГ...¿Quién?¿Quién?.
HХ (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)¿Quién?¿Quién?...
IИИy)ИИИ....(j/y)
J(j/y)(j/y)(j/y)(j/y)(j/y)(j/y)θ (th)
φ (ph/f)
Ξ (x/ks)K)(k final)
KКККККК...(l).
LЛЛЛЛЛЛm).
MММММММ...n)(m final)
NНННННН...Ξ (x/ks)(m)
OОООООО..Ξ (x/ks).(n final)
PППППППO)n)
Q(ja/ya)(ja/ya)(ja/ya)Љ (lj/ly)Љ (lj/ly)Ќ (Ḱ/kj).ͅi)(p)Ρ (r)(s)
RРРРРРРΡΡΡ.
ς (s final)
неннный (наликования /)
SСССССС....(p final)
T..........(p)
UУУУУУУSí..Sí.Sí.ץ (Lis/ts final)
Vvertido (Z)vertido (Z)vertido (Z)ВВВς (s final)
π (p)
Ω (ō)Governing (f/ph)Governing (f/ph)(en adelante)
WВ (v)В (v)В (v)ü (nj/ny/ñ)ü (nj/ny/ñ)Ѓ (Ω (ō)ς (s final)ς (s final)(ch/kh)OSE (q)
XЏ (dž)Џ (dž)Љ (lj/ly)Ξ(ch/kh)(ch/kh)Ψ (ps)ר (r)
Y(y/ı)неперен (′′ / proclamar/cifrar)i)Ѕ (dz)Ѕ (dz)ü (nj/ny/ñ)Ψ (ps)Sí.Ψ (ps)Ω (ō)(š/sh)
ZЗЗЗЗЗЗΩ (ō)Ϊt)
[
{}
(š/sh)(š/sh)(š/sh)(š/sh)(š/sh)(ć)[
{}
̓
̔͂
[
{}
Ϋ[
{}

Silencio
e)e)(je/ye)No.Ѓ (vertido (Z)
Silencio
.
̔ (h)

Silencio
CCD
ό

Silencio
]
}
Щ (šč)Щ (šč)Щ (šč)(ć)Ќ (Ḱ/kj)No.]
}
.
̔
]
}
Génesis
Alternativa
]
}
^
~
Ч (č)Ч (č)Ч (č)Ч (č)Ч (č)(š/sh)
~
?
.
^
̅
Ø
^
̅
¿Qué?(y/ı) sano (ji/yi)¿Qué?¿Qué?Џ (dž)¿Qué?¿Qué?¿Qué?ί¿Qué?

Contenido relacionado

Archivo de computadora

Un archivo informático es un recurso informático para registrar datos en un dispositivo de almacenamiento informático, identificado principalmente por su...

Ninon

Ninon es una tela ligera y transparente hecha con tejido liso o de gasa de vuelta, es un material adecuado para cortinas, ropa de noche y lencería. Ninon...

Seda de Laos

La seda de Laos se produce en Laos con antiguas técnicas de tejido que producen seda de alta calidad. Esta tela tejida se ha utilizado tradicionalmente para...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save