ISO 639

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Estándar de representación de nombres para grupos de idiomas y idiomas

ISO 639 es un conjunto de normas de la Organización Internacional de Normalización que se ocupa de la representación de nombres para idiomas y grupos de idiomas.

También era el nombre de la norma original, aprobada en 1967 (como ISO 639/R) y retirada en 2002. El conjunto ISO 639 ahora consta de cinco partes, ya que la parte 6 fue retirada.

Uso de códigos ISO 639

Los códigos de idioma definidos en las diversas secciones de ISO 639 se utilizan con fines bibliográficos y, en entornos informáticos y de Internet, como un elemento clave de los datos locales. Los códigos también encuentran uso en varias aplicaciones, como las URL de Wikipedia para sus ediciones en diferentes idiomas.

Partes actuales e históricas del estándar

Estándar NombreCódigos para la representación de nombres de idiomas –...) Autoridad de registro Primera edición Corriente No. in list (as of 18 February 2021)
ISO 639-1 Parte 1: Código Alfa-2Infoterm 1967 (como ISO 639)2002 184
ISO 639-2 Parte 2: Código Alfa-3Biblioteca del Congreso 19981998 482 + 20 B solo + 4 especiales + 520 para uso local
ISO 639-3 Parte 3: Código Alfa-3 para la cobertura integral de idiomasSIL International 20072007 7,893 + 4 especiales + 520 para uso local
ISO 639-4 Parte 4: Directrices de aplicación y principios generales para la codificación de idiomasISO/TC 37/SC 2 2010-07-162010-07-16 (no una lista)
ISO 639-5 Parte 5: Código Alfa-3 para familias y grupos de idiomasBiblioteca del Congreso 2008-05-152013-02-11 115 (incluidos 36 restantes + 29 grupos regulares de ISO 632-2)
ISO 639-6 Parte 6: Representación alfa-4 para una cobertura integral de las variantes lingüísticas (retirada) Geolang 2009-11-17retirado 21.000+

Cada parte del estándar es mantenida por una agencia de mantenimiento, que agrega códigos y cambia el estado de los códigos cuando es necesario. ISO 639-6 se retiró en 2014.

Características de los códigos individuales

Ámbitos:

  • Idiomas individuales
  • Macrolanguages (Parte 3)
  • Colecciones de idiomas (Partes 1, 2, 5). La parte 1 contiene sólo una colección (bh), algunas colecciones ya estaban en la Parte 2, y otras se agregaron sólo en la Parte 5:
    • Grupos de Restauración: 36 colecciones tanto en la Parte 2 como en la 5 son de este tipo (incluido uno que también fue codificado en la Parte 1), para compatibilidad con la Parte 2 cuando la Parte 5 todavía no fue publicada, los grupos restantes no contienen ningún idioma y colección que ya se codifica en la Parte 2 (cuando nuevas aplicaciones compatibles con la Parte 5 puedan tratar estos grupos de manera inclusiva, siempre que respeten la jerarquía de contención publicada en la Parte 5 y utilicen la colección más específica);
    • Grupos regulares: 29 colecciones en ambas partes 2 y 5 son de este tipo, para compatibilidad con la Parte 2, no pueden contener otros grupos;
    • Familias: 50 nuevas colecciones codificadas sólo en la Parte 5 (incluyendo una que contiene un grupo regular ya codificado en la Parte 2), para la compatibilidad con la Parte 2, pueden contener otras colecciones excepto grupos restantes.
  • Dialectas: estaban destinadas a ser cubiertos por la Parte 6 (propuesta pero ahora retirada).
  • Situaciones especiales (Partes 2, 3).
  • Reservado para uso local (Partes 2, 3). También se utiliza a veces en aplicaciones que necesitan un código alfa-2 como códigos estándar en las Partes 1 y 2 (donde el código especial mis no es adecuado), o un código alfa-3 para colecciones como códigos estándar en la Parte 5.

Tipos (para idiomas individuales):

  • Idiomas vivos (Partes 2, 3) (todos los macrolanguagos son idiomas vivos)
  • Idiomas extintos (Partes 2, 3) (608, 5 de ellos están en la Parte 2: chb, chg, cop, lui, sam; ninguno está en la Parte 1)
  • Idiomas antiguos (Partes 1, 2, 3) (124, 19 de ellos están en la Parte 2; y 5 de ellos, a saber: ave, chu, lat, pli y san, también tiene un código en la Parte 1: ae, cu, la, pi, sa)
  • Idiomas históricos (Partes 2, 3) (83, 16 de ellos están en la Parte 2; ninguno está en la Parte 1)
  • Idiomas estructurados (Parte 1, 2, 3) (23, 9 de ellos en la Parte 2: afh, epo, ido, ile, ina, jbo, tlh, vol, zbl; 5 de ellos en la Parte 1: eo, ia, ie, io, vo)

Lenguajes individuales y macrolenguajes con dos códigos alfa-3 distintos en la Parte 2:

  • Bibliográfico (algunos de ellos fueron deprecados, ninguno fue definido en la Parte 3): estos son códigos heredados (basados en nombres de idiomas en inglés).
  • Terminologic (también definido en la Parte 3): estos son los códigos preferidos (basados en nombres de idiomas nativos, romanizados si es necesario).
  • Todos los demás (incluyendo colecciones de idiomas y códigos especiales/reservidos) sólo tienen un código alfa-3 único para ambos usos.

Relaciones entre las partes

Las diferentes partes de ISO 639 están diseñadas para trabajar juntas, de tal manera que ningún código signifique una cosa en una parte y otra cosa en otra. Sin embargo, no todos los idiomas están en todas las partes, y hay una variedad de formas diferentes en que los idiomas específicos y otros elementos se tratan en las diferentes partes. Esto depende, por ejemplo, de si un idioma figura en la lista de las Partes 1 o 2, si tiene códigos B/T separados en la Parte 2 o si está clasificado como un macrolenguaje en la Parte 3, etc.

Estos diversos tratamientos se detallan en el siguiente cuadro. En cada grupo de filas (una para cada alcance de ISO 639-3), las últimas cuatro columnas contienen códigos para un lenguaje representativo que ejemplifica un tipo específico de relación entre las partes de ISO 639, la segunda columna proporciona una explicación de la relación, y la primera columna indica el número de elementos que tienen ese tipo de relación. Por ejemplo, hay cuatro elementos que tienen un código en la Parte 1, tienen un código B/T y se clasifican como macrolenguajes en la Parte 3. Un representante de estos cuatro elementos es "persa" fa/per/fas.

Ámbito Número de casos Descripción Ejemplo de códigos iguales
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
Idiomas individuales
("I")
128 Idiomas individuales no parte de un lenguaje macro, con código en cada Parte 1, 2 y 3 (sólo un código en la Parte 2).
Hay 184 códigos asignados en la Parte 1 para idiomas individuales, macrolanguages o grupos; restar los contados en filas abajo, estas hojas: 184 - (2 "I (antiguo B/T)") − (3+11 "I") − (3+2 "I (B/T)") ‒ (28+4+1+1 "M") − (1 "C") = 128 códigos.
eneng
2 Idiomas individuales, con código en cada Parte 1, 2 y 3, que tenían códigos B/T separados en la Parte 2, pero cuyos códigos B fueron retirados (desde 2008-06-28) manteniendo sus códigos T para todos los usos. Estos son: hr/(scr)/hrv, y sr/(ser)/srp.
Ambos son parte de la misma macroidioma hbs añadido en la Parte 3 para incluir también otros idiomas individuales recién codificados, pero su código sh en la Parte 1 también se retiró y no tenía ningún código definido en la Parte 2.
hr(scr)/hrv (B/T)hrv
3 Idiomas individuales pertenecientes a una macrolengua en la Parte 3, con un código único en la Parte 2 y también con un código en la Parte 1. Estos son: bs/bos (parte de macroidioma hbs), nb/nob y nn/non (tanto parte de macroidioma no/nor). nbnob
11 Idiomas individuales con códigos B/T separados en la Parte 2, pero no en ninguno de los casos especiales en líneas de éxito.
Hay 20 pares de códigos B/T separados asignados en la Parte 2 a idiomas individuales o macrolanguagos; restar los casos especiales a continuación, estas hojas: 20 − (3+2 "M") − (4 "C") = 11 pares de códigos.
deger/deu (B/T)deu
3 Idiomas individuales con códigos B/T separados en la Parte 2 pero las letras del código Parte 1 no son las dos primeras letras del código de la Parte 2 T. Estos son: cs/cze/ces, mi/mao/mri, y sk/slo/slk. ccze/ces (B/T)ces
3 Los idiomas individuales de las Partes 2 y 3 (no pertenecen a un idioma macro), pero que fueron cubiertos en la Parte 1 por un código cuyo equivalente en la parte 2 es un colectivo. Estos son: bho, mai, y mag. bh)Bho
pocosCualquier otro idioma individual en las Partes 2 y 3, sin código en la Parte 1. Ast
1 Idiomas individuales añadidos en la Parte 3 sin códigos en las Partes 1 y 2, pero que fueron cubiertos por una macroidioma en las Partes 2 y 3 también codificados en la Parte 1. (ar)(ara)arb
1 Un idioma individual en la Parte 3, sin código en la Parte 2, pero fue cubierto en la Parte 1 por un código cuyo equivalente en la Parte 2 es un grupo colectivo (ver la entrada abajo para este grupo). bh)(bih)Sck
■ 7.000 Cualquier otro idioma individual en la tercera parte sin ningún código en las partes 1 y 2 (posiblemente cubierto en la segunda parte por un código colectivo, como nic "Niger-Kodofanian (Otros)" que es un grupo restante. (nic)aaaa
Macrolanguages
("M")
28 Macrolanguages en la Parte 3 que también tienen códigos en la Parte 1 y 2.
Hay 62 códigos asignados en la Parte 3 para macrolanguagos; restar los que tienen casos especiales a continuación, estas hojas: 62 − (4 "B/T") - 1 − (25+1+3 "no en la Parte 1") = 28 códigos.
arara
4 Macrolanguages en la Parte 3 con códigos B/T separados en la Parte 2. Estos son: fa/per/fas, ms/may/msa, sq/alb/sqi, y zh/chi/zho. faper/fas (B/T)fas
1 Macrolanguage en la Parte 3 que contiene idiomas que tienen códigos en la Parte 1. Sólo: no/nor (contiene: nb/nob, y nn/non). noni
25 Macrolanguages en las Partes 2 y 3, pero sin código en la Parte 1. balsa
1 Macrolanguage in Part 3, without code in Part 2, and whose code in Part 1 is deprecated. (sh)hbs
3 Macrolanguages en la Parte 3, sin códigos en la Parte 1 o 2. Estos son: bnc, kln, y luy. bnc
Familias y grupos (colectivos)
("C")
1 Bihari está marcado como colectivo y tiene un código ISO 639-2 y es el único grupo de idiomas que también tiene un código ISO 639-1 (donde todos los demás códigos son idiomas individuales o reservados). La razón es que tres idiomas individuales Bihari (que son lo suficientemente diferentes que no pueden formar el mismo macroidio para ISO 639-3) recibieron códigos ISO 639-2 distintivos (bho, mai, mag), que hizo Bihari un grupo restante para los propósitos de ISO 639-2 (contiene idiomas del grupo excepto estos tres). bh BihBih
35 Grupos de Restauración en la Parte 2, es decir, el mismo código pero diferentes idiomas incluidos. En la segunda parte afa se refiere a un lenguaje afroasiático que no tiene un identificador de lengua individual en la Parte 2, y que no cae en los tres grupos restantes: ber "Berber (Other)", cus "Cushitic (Other)", o sem "Semita (otras)", todos ellos grupos de lengua afroasiática. afaafa
29 Grupo regular en la Parte 2, igual que la familia de idiomas en la Parte 5, sin código en la Parte 1. Entre ellos, el grupo regular ypk en la Parte 2 fue el único que había sido codificado en la Parte 5 como parte de otro nuevo grupo regular en la Parte 5 que no fue codificado en la Parte 2 (ver abajo). ausaus
50 Grupos regulares añadidos sólo en la Parte 5, no previamente codificados en las Partes 1, 2 y 3. La mayoría de estos nuevos grupos regulares pueden haber sido representados anteriormente por otro código colectivo en la Parte 2 como parte de un grupo restante (por ejemplo, el grupo restante) ine para el nuevo grupo ordinario sqj), excepto 7 de ellos: aav, esx, euq, hmx, jpx, urj, así como syd (parte del nuevo grupo ordinario urj). El grupo ordinario ypk (parte del nuevo grupo ordinario esx) sin embargo ya fue codificado en la Parte 2. Vea la jerarquía de grupos de idiomas en la Lista de códigos ISO 639-5. sqj
Códigos especiales
("S")
1 Disponible para ser utilizado en un contexto monolingüe donde se requiere un código de idioma individual, pero el idioma en sí no tiene código estándar. Una alternativa más precisa podría ser el uso de un grupo restante de ISO 639-2 o un código familiar de idiomas de ISO 639-5, a menos que otros idiomas de ese grupo sean excluidos (como están separados con su propio código) o ningún código colectivo estándar es adecuado. Algunas aplicaciones pueden preferir utilizar un código más específico dentro de las reservadas para uso local. mal
1 Contenido multilingüe (incluye al menos dos idiomas en partes separables). Para ser utilizado cuando se espera un código de idioma para todo el contenido. Los idiomas individuales o los macrolanguagos para cada parte del contenido pueden ser posiblemente aún incódigos (y representables como mis o más precisamente con un código colectivo). mul
1 Indeterminado (el contenido incluye cero, uno o muchos idiomas, en combinación arbitraria). und
1 No hay información lingüística en absoluto (added 2006-01-11). El contenido (p. ej. gráficos, fotos o archivos de audio/vídeo que no incluyen texto en un idioma humano, o metadatos técnicos y la mayoría de código fuente de programación) es utilizable como es con cualquier idioma y no debe ser traducido (excepto por su descripción posiblemente asociada en contenidos separados, o para fragmentos no esenciales del contenido). zxx
Reservado para uso local
("R")
20 Códigos alfa2 en la Parte 1, en el rango qa.. qt. Estos códigos no se recomiendan, pero no se consignan en la Parte 1. qa
520 Códigos alfa3 en las partes 2 y 3, en el rango qaa... qtz. Estos códigos también se pueden utilizar para idiomas colectivos (o otros casos especiales), pero no se asignarán familias y grupos de idiomas estándar en la Parte 5. qaa

Estas diferencias se deben a los siguientes factores.

En ISO 639-2, se asignaron dos códigos distintos a 22 idiomas individuales, a saber, un código bibliográfico y otro terminológico (códigos B/T). Los códigos B se incluyeron por razones históricas porque los sistemas bibliográficos ampliamente utilizados anteriormente usaban códigos de idioma basados en el nombre en inglés del idioma. Por el contrario, los códigos ISO 639-1 se basaron en el nombre nativo del idioma, y también hubo un fuerte deseo de tener códigos 639-2 (códigos T) para estos idiomas que fueran similares al código de 2 caracteres correspondiente en Norma ISO 639-1.

  • Por ejemplo, el idioma alemán (Parte 1: de) tiene dos códigos en la Parte 2: ger (B code) and deu (Código T), mientras que sólo hay un código en la Parte 2, eng, para el idioma inglés.
  • 2 ex Los códigos B fueron retirados, dejando hoy sólo 20 pares de códigos B/T.

Los idiomas individuales en la Parte 2 siempre tienen un código en la Parte 3 (solo se reutiliza el código terminológico de la Parte 2) pero pueden o no tener un código en la Parte 1, como se ilustra en los siguientes ejemplos:

  • Parte 3 eng corresponde a la Parte 2 eng y Parte 1 en
  • Parte 3 ast corresponde a la Parte 2 ast pero carece de un código en la Parte 1.

Algunos códigos (62) en la Parte 3 son macrolenguajes. Estos son grupos que contienen múltiples idiomas individuales que tienen un buen entendimiento mutuo y comúnmente se mezclan o confunden. Algunos macrolenguajes desarrollaron una forma estándar predeterminada en uno de sus idiomas individuales (p. ej., el mandarín está implícito de forma predeterminada para el macrolenguaje chino, otros idiomas individuales aún pueden distinguirse si es necesario, pero el código específico cmn para mandarín rara vez es usado).

  • 1 macroidioma tiene un código Parte 2 y un código Parte 1, mientras que sus idiomas miembros también tienen códigos en la Parte 1 y la Parte 2: nor/no contiene non/nn, nob/nb; o
  • 4 macrolanguagos tienen dos códigos Parte 2 (B/T) y un código Parte 1: per/fas/fa, may/msa/ms, alb/sqi/sq, y chi/zho/zh;
  • 28 macrolanguagos tienen un código de la Parte 2 pero ningún código de la Parte 1;
  • 29 otros macrolanguagos sólo tienen códigos en la Parte 3.

Los códigos colectivos en la Parte 2 tienen un código en la Parte 5: p. aus en las Partes 2 y 5, que significa idiomas australianos.

  • Un código colectivo en la Parte 2 también tiene un código en la Parte 1: bih/bh.
  • Algunos códigos se agregaron en la Parte 5 pero no tenían código en la Parte 2: por ejemplo. sqj

Las partes 2 y 3 también tienen un rango reservado y cuatro códigos especiales:

  • Códigos qaa a través de qtz se reservan para uso local.
  • Hay cuatro códigos especiales: mis para los idiomas que aún no tienen código asignado, mul para "idiomas múltiples", und para "indefinidos", y zxx para "no contenido lingüístico, no aplicable".

Espacio de código

Espacio de código alfa-2

"Alfa-2" Los códigos (para códigos compuestos por 2 letras del alfabeto latino básico ISO) se utilizan en ISO 639-1. Cuando se deseaban códigos para una gama más amplia de idiomas, más de 2 combinaciones de letras podían cubrir (un máximo de 262 = 676), ISO 639-2 se desarrolló utilizando códigos Alpha-3. (Sin embargo, este último se publicó formalmente primero).

Espacio de código alfa-3

"Alfa-3" Los códigos (para códigos compuestos por 3 letras del alfabeto latino básico ISO) se utilizan en ISO 639-2, ISO 639-3 e ISO 639-5. El número de idiomas y grupos de idiomas que se pueden representar así es 263 = 17.576.

El uso común de códigos Alpha-3 por tres partes de ISO 639 requiere cierta coordinación dentro de un sistema más grande.

La Parte 2 define cuatro códigos especiales mis, mul, und, zxx, un rango reservado qaa-qtz (20 × 26 = 520 códigos) y tiene 20 entradas dobles (los códigos B/T), más 2 entradas con códigos B obsoletos. Esto suma 520 + 22 + 4 = 546 códigos que no se pueden usar en la parte 3 para representar idiomas o en la parte 5 para representar familias o grupos de idiomas. El resto es 17 576 – 546 = 17 030.

Hay alrededor de seis o siete mil idiomas en la Tierra hoy. Entonces, esos 17,030 códigos son adecuados para asignar un código único a cada idioma, aunque algunos idiomas pueden terminar con códigos arbitrarios que no se parecen en nada a los nombres tradicionales de ese idioma.

Espacio de código alfa-4 (retirado)

"Alfa-4" (para códigos compuestos por 4 letras del alfabeto latino básico de ISO) se propusieron para ser utilizados en ISO 639-6, que ha sido retirado. El límite superior para el número de idiomas y dialectos que se pueden representar es 264 = 456 976.

Notas y referencias

  1. ^ "ISO/R 639:1967". Iso.org. 1988-03-01. Retrieved 2012-08-05.
  2. ^ "ISO 639:1988". Iso.org. Retrieved 2012-08-05.
  3. ^ "Codes ordenados alfa-3/ISO 639-2 Code". Biblioteca del Congreso. 2013-07-25. Retrieved 2019-01-10.
  4. ^ "ISO-639-2 Codes". Biblioteca del Congreso. Retrieved 2019-01-10.
  5. ^ "ISO 639 tablas de código". Sil.org. Retrieved 2021-04-07.
  6. ^ "ISO 639-5 Change Notice". Network Development " MARC Oficina de Normas. Biblioteca del Congreso. Retrieved 12 de diciembre, 2018.
  7. ^ "ISO 639-5 codes ordered by Identifier". Network Development " MARC Oficina de Normas. Biblioteca del Congreso. Retrieved 12 de diciembre, 2018.
  8. ^ ISO 639-6:2009, ISO.
  9. ^ "ISO 639 tablas clave: macrolanguages". Sil.org. Retrieved 2012-08-05.
  10. ^ "ISO 639 tablas de código: extinguidas". Sil.org. Retrieved 2012-08-05.
  11. ^ "ISO 639 tablas clave: antiguas". Sil.org. Retrieved 2019-01-10.
  12. ^ "ISO 639 tablas clave: históricas". Sil.org. Retrieved 2012-08-05.
  13. ^ "ISO 639 tablas de código: construidas". Sil.org. Retrieved 2022-02-07.
  14. ^ "ISO 639-2 – Preguntas Frecuentes". loc.gov. 2014-05-05. Retrieved 2014-12.
  15. ^ "Codes para la representación de nombres de idiomas - Parte 2: Código Alfa-3". International Organization for Standards. ISO. Retrieved 10 de enero 2019. Fecha de publicación: 1998-10
  16. ^ "Codes para la representación de nombres de idiomas - Parte 1: Código Alfa-2". International Organization for Standards. ISO. Retrieved 15 de febrero 2018. Fecha de publicación: 2002-07
  17. ^ "Statistical Summaries". Ethnologue. Retrieved 2012-08-05.

Contenido relacionado

Lógica de primer orden

Lógica de primer orden: también conocida como lógica de predicados, lógica cuantificacional y cálculo de predicados de primer orden—es una colección...

Lógica secuencial

La lógica secuencial es un tipo de circuito lógico cuya salida depende tanto de los valores de entrada actuales como de los valores de entradas anteriores...

Aridad

Aridad es el número de argumentos u operandos tomados por una función, operación o relación en lógica, matemáticas e informática. En matemáticas, la...

Puerta lógica

Una puerta lógica es un dispositivo idealizado o físico que implementa una función booleana, una operación lógica realizada en una o más entradas...

Lenguaje formal

En lógica, matemáticas, informática y lingüística, un lenguaje formal consta de palabras cuyas letras se toman de un alfabeto y están bien formadas de...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save