Orden alfabetico
Orden alfabético es un sistema mediante el cual las cadenas de caracteres se colocan en orden según la posición de los caracteres en el orden convencional de un alfabeto. Es uno de los métodos de recopilación. En matemáticas, un orden lexicográfico es la generalización del orden alfabético a otros tipos de datos, como secuencias de números u otros objetos matemáticos ordenados.
Cuando se aplica a cadenas o secuencias que pueden contener dígitos, números o tipos de elementos más elaborados, además de caracteres alfabéticos, el orden alfabético generalmente se denomina orden lexicográfico.
Para determinar cuál de dos cadenas de caracteres aparece primero al ordenarlos en orden alfabético, se comparan sus primeras letras. Si difieren, entonces la cadena cuya primera letra aparece antes en el alfabeto aparece antes que la otra cadena. Si las primeras letras son iguales, se comparan las segundas letras, y así sucesivamente. Si se alcanza una posición en la que una cadena no tiene más letras para comparar mientras que la otra sí, se considera que la primera cadena (más corta) ocupa el primer lugar en orden alfabético.
Las letras mayúsculas o mayúsculas generalmente se consideran idénticas a sus correspondientes letras minúsculas a los efectos del orden alfabético, aunque se pueden adoptar convenciones para manejar situaciones en las que dos cadenas difieren sólo en el uso de mayúsculas. También existen varias convenciones para el manejo de cadenas que contienen espacios, letras modificadas, como las que tienen signos diacríticos, y caracteres que no son letras, como los signos de puntuación.
El resultado de colocar un conjunto de palabras o cadenas en orden alfabético es que todas las cadenas que comienzan con la misma letra se agrupan; dentro de esa agrupación se agrupan todas las palabras que comienzan con la misma secuencia de dos letras; etcétera. Por tanto, el sistema tiende a maximizar el número de letras iniciales comunes entre palabras adyacentes.
Historia
El orden alfabético fue utilizado por primera vez en el primer milenio a. C. por los escribas semíticos del noroeste que utilizaban el sistema abjad. Sin embargo, durante siglos se prefirió una variedad de otros métodos para clasificar y ordenar material, incluidos geográfico, cronológico, jerárquico y por categoría, al orden alfabético.
La Biblia data de los siglos VI y VII a.C. En el Libro de Jeremías, el profeta utiliza el cifrado de sustitución Atbash, basado en orden alfabético. De manera similar, los autores bíblicos utilizaron acrósticos basados en el alfabeto hebreo (ordenado).
El primer uso efectivo del orden alfabético como mecanismo de catalogación entre los eruditos puede haber sido en la antigua Alejandría, en la Gran Biblioteca de Alejandría, que fue fundada alrededor del año 300 a.C. Se cree que el poeta y erudito Calímaco, que trabajó allí, creó el primer catálogo de biblioteca del mundo, conocido como Pinakes, con pergaminos archivados en orden alfabético de la primera letra de los autores. nombres.
En el siglo I a. C., el escritor romano Varrón compiló listas alfabéticas de autores y títulos. En el siglo II d.C., Sexto Pompeyo Festo escribió un epítome enciclopédico de las obras de Verrius Flaccus, De verborum significatu, con entradas en orden alfabético. En el siglo III d.C., Harpocración escribió un léxico homérico ordenado alfabéticamente por todas las letras. En el siglo X, el autor de la Suda utilizó el orden alfabético con variaciones fonéticas.
El orden alfabético como ayuda para la consulta comenzó a incorporarse a la corriente principal de la vida intelectual de Europa occidental en la segunda mitad del siglo XII, cuando se desarrollaron herramientas alfabéticas para ayudar a los predicadores a analizar el vocabulario bíblico. Esto llevó a la compilación de concordancias alfabéticas de la Biblia por los frailes dominicos en París en el siglo XIII, bajo Hugo de Saint Cher. Las obras de referencia más antiguas, como las Interpretaciones de nombres hebreos de San Jerónimo, se ordenaron alfabéticamente para facilitar su consulta. Inicialmente, los académicos se resistieron al uso del orden alfabético, que esperaban que sus estudiantes dominaran su área de estudio de acuerdo con sus propias estructuras racionales; su éxito fue impulsado por herramientas como el índice de Robert Kilwardby de las obras de San Agustín, que ayudó a los lectores a acceder al texto original completo en lugar de depender de las compilaciones de extractos que se habían vuelto prominentes en la escolástica del siglo XII. La adopción del orden alfabético fue parte de la transición de la primacía de la memoria a la de las obras escritas. La idea de ordenar la información según el orden alfabético también encontró resistencia por parte de los compiladores de enciclopedias de los siglos XII y XIII, todos ellos devotos eclesiásticos. Preferían organizar su material teológicamente, en el orden de la creación de Dios, comenzando con Deus (que significa Dios).
En 1604, Robert Cawdrey tuvo que explicar en Table Alphabeticall, el primer diccionario monolingüe de inglés, "Ahora, si la palabra que deseas encontrar comienza con (a), entonces busca". al principio de esta Tabla, pero si con (v) mire hacia el final". Aunque todavía en 1803 Samuel Taylor Coleridge condenaba las enciclopedias con "una disposición determinada por el accidente de las letras iniciales", hoy en día muchas listas se basan en este principio.
La disposición en orden alfabético puede verse como una fuerza para democratizar el acceso a la información, ya que no requiere conocimientos previos extensos para encontrar lo que se necesita.
Ordenar en escritura latina
Orden básico y ejemplos
El orden estándar del alfabeto latino básico ISO moderno es:
- A-B-C-D-E-F-G-H-I-J-K-L-M-N-O-P-Q-R-S-T-U-V-W-X-Y-Z
A continuación se muestra un ejemplo de orden alfabético sencillo:
- As; Aster; Astrolabe; Astronomía; Astrofísica; At; Ataman; Attack; Baa
Otro ejemplo:
- Barnacle; Be; Been; Beneficio; Bent
Las palabras anteriores están ordenadas alfabéticamente. As viene antes de Aster porque comienzan con las mismas dos letras y As no tiene más letras después de eso, mientras que Aster hace. Las siguientes tres palabras vienen después de Aster porque su cuarta letra (la primera que difiere) es r, que viene después de e (la cuarta letra de Aster) en el alfabeto. Esas palabras en sí están ordenadas según su sexta letra (l, n y p respectivamente). Luego viene At, que se diferencia de las palabras anteriores en la segunda letra (t viene después de s). Ataman viene después de At por la misma razón que Aster vino después de As. Attack sigue a Ataman según la comparación de sus terceras letras, y Baa viene después de todas las demás porque tiene una primera letra diferente.
Tratamiento de cadenas multipalabra
Cuando algunas de las cadenas que se están ordenando constan de más de una palabra, es decir, contienen espacios u otros separadores como guiones, se pueden adoptar dos enfoques básicos. En el primer enfoque, todas las cadenas se ordenan inicialmente según su primera palabra, como en la secuencia:
- Oak; Oak Hill; Oak Ridge; Oakley Park; Oakley River
- donde todas las cuerdas comienzan con la palabra separada Roble precede a todos los que comienzan con Oakley, porque Roble precedes Oakley en orden alfabético.
En el segundo enfoque, las cadenas se ordenan alfabéticamente como si no tuvieran espacios, dando la secuencia:
- Oak; Oak Hill; Oakley Park; Oakley River; Oak Ridge
- Donde Oak Ridge ahora viene después de la Oakley cuerdas, como si fuera escrito "Oakridge".
El segundo enfoque es el que se suele adoptar en los diccionarios y, por eso, los editores suelen denominarlo orden del diccionario. El primer enfoque se ha utilizado a menudo en los índices de libros, aunque cada editor tradicionalmente establece sus propios estándares sobre qué enfoque utilizar en ellos; No existía ninguna norma ISO para índices de libros (ISO 999) antes de 1975.
Casos especiales
Letras modificadas
En francés, las letras modificadas (como las que tienen signos diacríticos) se tratan igual que la letra base a efectos de orden alfabético. Por ejemplo, rôle viene entre rock y rosa, como si estuviera escrito rol. Sin embargo, los idiomas que utilizan este tipo de letras sistemáticamente generalmente tienen sus propias reglas de ordenación. Consulte § Convenciones específicas del idioma a continuación.
Ordenar por apellido
En la mayoría de las culturas donde los apellidos se escriben después de los nombres de pila, todavía es deseable ordenar las listas de nombres (como en los directorios telefónicos) por apellido primero. En este caso, es necesario reordenar los nombres para ordenarlos correctamente. Por ejemplo, Juan Hernandes y Brian O'Leary deben ordenarse como "Hernandes, Juan" y "O'Leary, Brian" incluso si no están escritos de esta manera. Captar esta regla en un algoritmo de clasificación por computadora es complejo y los intentos simples fracasarán. Por ejemplo, a menos que el algoritmo tenga a su disposición una lista extensa de apellidos, no hay manera de decidir si "Gillian Lucille van der Waal" es "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der", o incluso "Lucille van der Waal, Gillian".
La ordenación por apellido se encuentra frecuentemente en contextos académicos. Dentro de un único artículo de varios autores, ordenar a los autores alfabéticamente por apellido, en lugar de utilizar otros métodos como la antigüedad inversa o el grado subjetivo de contribución al artículo, se considera una forma de "reconocer contribuciones similares" 34; o "evitar la falta de armonía en los grupos colaboradores". Se ha descubierto que la práctica en ciertos campos de ordenar las citas en las bibliografías por los apellidos de sus autores crea un sesgo a favor de los autores con apellidos que aparecen más temprano en el alfabeto, mientras que este efecto no aparece en campos en los que las bibliografías están ordenadas cronológicamente.
Las y otras palabras comunes
Si una frase comienza con una palabra muy común (como "the", "a" o "an", llamadas artículos en gramática), esa palabra A veces se ignora o se traslada al final de la frase, pero no siempre es así. Por ejemplo, el libro "El Resplandor" podría tratarse como "Shining" o "Shining, The" y por tanto antes del título del libro "El verano de Sam". Sin embargo, también puede tratarse simplemente como "El Resplandor" y después de "El verano de Sam". De manera similar, "Una arruga en el tiempo" podría tratarse como "Una arruga en el tiempo", "Una arruga en el tiempo, A" o "Una arruga en el tiempo". Los tres métodos de alfabetización son bastante fáciles de crear mediante algoritmos, pero muchos programas se basan en un orden lexicográfico simple.
Prefijos de Mac
Los prefijos M y Mc en los apellidos irlandeses y escoceses son abreviaturas de Mac y, a veces, están ordenados alfabéticamente como si la ortografía fuera Mac en su totalidad. Por lo tanto, McKinley podría aparecer antes de Mackintosh (como sucedería si se hubiera escrito como "MacKinley"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se utiliza en los directorios telefónicos británicos.
Prefijo St
El prefijo St o St. es una abreviatura de "Saint" y tradicionalmente se ordena alfabéticamente como si la ortografía fuera Saint en su totalidad. Por lo tanto, en un diccionario geográfico San Juan podría aparecer antes de Salem (como si así fuera si se hubiera escrito como "San Juan's"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se usa a veces.
Ligaduras
Las ligaduras (dos o más letras fusionadas en un símbolo) que no se consideran letras distintas, como Æ y Œ en inglés, normalmente se clasifican como si las letras estuvieran separadas: "æther" y "éter" se ordenaría igual en relación con todas las demás palabras. Esto es cierto incluso cuando la ligadura no es puramente estilística, como en préstamos y nombres de marcas.
Es posible que sea necesario adoptar reglas especiales para clasificar cadenas que varían únicamente según si dos letras están unidas por una ligadura.
Tratamiento de los números
Cuando algunas de las cadenas contienen números (u otros caracteres que no son letras), son posibles varios enfoques. A veces, estos caracteres se tratan como si estuvieran antes o después de todas las letras del alfabeto. Otro método consiste en ordenar los números alfabéticamente tal como se escribirían: por ejemplo, 1776 se ordenaría como si se deletreara "diecisiete setenta y seis" y 24 heures du Mans como si se deletreara "vingt-quatre..." (en francés “veinticuatro”). Cuando se utilizan números u otros símbolos como formas gráficas especiales de letras, como 1337 para leet o la película Seven (que fue estilizada como Se7en), se podrán ordenar como si fueran esas letras. El orden de clasificación natural ordena las cadenas alfabéticamente, excepto que los números de varios dígitos se tratan como un solo carácter y se ordenan por el valor del número codificado por los dígitos.
En el caso de los monarcas y papas, aunque sus números están en números romanos y se parecen a letras, normalmente están dispuestos en orden numérico: así, por ejemplo, aunque V va después de I, el rey danés Cristián IX va después de su predecesor Cristián VIII.
Convenciones específicas del idioma
Los idiomas que utilizan un alfabeto latino extendido generalmente tienen sus propias convenciones para el tratamiento de las letras adicionales. Además, en algunos idiomas, ciertos dígrafos se tratan como letras individuales a efectos de cotejo. Por ejemplo, el alfabeto español trata ñ como una letra básica que sigue a n, y anteriormente trataba los dígrafos ch y ll. > como letras básicas después de c y l, respectivamente. Ahora сh y ll están ordenados alfabéticamente como combinaciones de dos letras. La nueva regla de alfabetización fue emitida por la Real Academia Española en 1994. Estos dígrafos todavía se designaban formalmente como letras pero ya no lo son desde 2010. Por otro lado, el dígrafo rr sigue a rqu como se esperaba (y lo hizo incluso antes de la regla de alfabetización de 1994), mientras que las vocales con acentos agudos (á, é, í, ó, ú) siempre se han ordenado en paralelo con sus letras base, al igual que la letra ü.
En algunos casos, como el árabe y el kiowa, el alfabeto se ha reordenado por completo.
Las reglas de alfabetización aplicadas en varios idiomas se enumeran a continuación.
- En árabe, hay dos órdenes principales del alfabeto de 28 letras utilizado hoy. El estándar y más comúnmente utilizado es el alfabeto hijā, que fue acuñado por el lingüista árabe Nasr ibn 'Asim al-Laythi y cuenta con un método de orden visual donde, por ejemplo, las letras baa, taa, Øaaa ب ت Opinion se ordenan base en forma de baa. La orden original de abjad, que se asemeja fonéticamente a la de otras lenguas semíticas, así como latina, sigue en uso hoy, generalmente limitado para ordenar listas en un documento, análogo a los números romanos. Cuando el abjadiyya se utiliza en la numeración, una forma única abstracta de escribir las letras debe ser utilizado para distinguir esas letras de tres primeras letras de la frase así como de números. Por ejemplo, el Alef "ا" que parece idéntico al numeral hindi uno "١", un pequeño bucle ovalado se extiende a la derecha del fondo de la letra, seguido de una cola corta. Aunque estos caracteres raramente se utilizan digitalmente, han sido reconocidos bajo ASCII como alfabeto matemático árabe, con rangos de 1EE00 a 1EEFF. Hay un orden menos común, que se ordena fonéticamente Sawti Alphabet a partir del profundo sonido de la garganta haa al labio más meem. Este orden fue creado por Al-faraheedi.
- En Azerbaiyán hay ocho cartas adicionales al alfabeto latino estándar. Cinco de ellos son vocales: i, ı, ö, ü, y tres son consonantes: ç, ş, ğ. El alfabeto es el mismo que el turco, con los mismos sonidos escritos con las mismas letras, excepto tres letras adicionales: q, x y para sonidos que no existen en turco. Aunque todas las "cartas turcas" se collan en su orden alfabético "normal" como en turco, las tres letras extras se collan arbitrariamente después de letras cuyos sonidos se acercan a la suya. Así que q se colló justo después de k, x (pronunciado como un alemán ch) es collado justo después de h y la revista (pronunciado aproximadamente como un corto inglés a) está collado justo después de e.
- En Breton, no hay "c", "q", "x" pero hay los digraphs "ch" y "c'h", que están collados entre "b" y "d". Por ejemplo: « buzhugenn, chug, c'hoar, daeraouenn » (arriba, jugo, hermana, tearrop).
- En checo y eslovaco, las vocales acentuadas tienen un peso collante secundario, en comparación con otras letras, son tratadas como sus formas no centradas (en checo, A-Á, E-É, I-Í, O-Ó, U-Ú-Corte, Y-í y en eslovaco, A-Á-Ä, E-É, Iác, O-Ó-Ô, U-Úcent, Y-í), pero son correctas Los consonantes concentrados tienen peso collante primario y se collan inmediatamente después de sus contrapartes no centradas, con excepción de, нели y непони (en checo) y, не, не, не y неперененния (en eslovaco), que tienen de nuevo peso secundario. CH se considera una carta separada y va entre H y I. En Eslovaco, DZ y DŽ también se consideran cartas separadas y se colocan entre î y E.
- En los alfabetos daneses y noruegos, las mismas vocales adicionales que en sueco (ver abajo) también están presentes pero en un orden diferente y con diferentes glifos (..., X, Y, Z, È, Ø, Å). Además, "Aa" colila como equivalente a "Å". El alfabeto danés ha visto tradicionalmente "W" como una variante de "V", pero hoy "W" se considera una letra separada.
- En holandés la combinación IJ (representando IJ) fue antes de ser collado como Y (o a veces como una carta separada: Y ANTERITO IJ = Z), pero actualmente se colló en su mayoría como 2 letras (II) IJ hizo IK. Las excepciones son directorios telefónicos; IJ siempre es collado como Y aquí porque en muchos nombres de familia holandeses Y se utiliza donde la ortografía moderna requeriría IJ. Tenga en cuenta que una palabra que comienza con ij que está escrito con una capital también estoy escrito con una capital J, por ejemplo, la ciudad IJmuiden, el río IJssel y el país IJsland (Islandia).
- En Esperanto, los consonantes con acentos circunflex (correo, ющ, ĵ, ŝ, grieta), así como ы (u con breve), se cuentan como letras separadas y se collaron por separado (c, clarificar, d, e, f, g, soluble, h, ĥ, i, j,, grieta, t, soluble, v, z).
- En Estonia, õ, ä, ö y ü se consideran cartas separadas y collate después de w. Cartas š, z y ž aparecen en palabras de préstamo y nombres propios extranjeros solamente y siguen la letra s en el alfabeto estonio, que de otro modo no difiere del alfabeto latino básico.
- El alfabeto de las Islas Feroe también tiene algunas de las letras extra danesas, noruegas y suecas, a saber: È y Ø. Además, el alfabeto de las Islas Feroe utiliza el éxodo islandés, que sigue el D. Cinco de las seis vocales A, I, O, U y Y pueden obtener acentos y son después de que se consideran letras separadas. Los consonantes C, Q, X, W y Z no se encuentran. Por lo tanto, las cinco primeras letras son A, Á, B, D y Ð, y las últimas cinco son V, Y, í, Ø
- En Filipino (Tagalog) y otros idiomas filipinos, la letra Ng se trata como una carta separada. Se pronuncia como en cantar, ping-pong, etc. Por sí mismo, se pronuncia nang, pero en general la ortografía filipina, se escribe como si fueran dos letras separadas (n y g). Además, los derivados de cartas (como Ñ) siguen inmediatamente la letra base. Filipino también está escrito con diacríticos, pero su uso es muy raro (excepto el tilde).
- El alfabeto finlandés y las reglas de collating son las mismas que las del sueco.
- Para francés, el último El acento en una palabra determinada determina el orden. Por ejemplo, en francés, las siguientes cuatro palabras se clasificarían de esta manera: cote iere côte iere coté iere côté.
- En letras alemanas con umlaut (Ä, Ö, Ü) se tratan generalmente como sus versiones no auspiciadas; ß siempre se clasifica como ss. Esto hace el orden alfabético Arbeit, Arg, Ärgerlich, Argument, Arm, Assistant, Aßlar, Assoziation. Para directorios telefónicos y listas similares de nombres, los umlauts deben ser collados como las combinaciones de letras "ae", "oe", "ue" porque una serie de apellidos alemanes aparecen tanto con umlaut como en la forma no aplaudida con "e" (Müller/Mueller). Esto hace el orden alfabético Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
- Las vocales húngaras tienen acentos, umlauts y dobles acentos, mientras que los consonantes están escritos con caracteres individuales, dobles (digraphs) o triples (trigraph). En collating, las vocales acentuadas son equivalentes con sus contrapartes no centradas y caracteres dobles y triples siguen sus originales individuales. El orden alfabético húngaro es: A=Á, B, C, Cs, D, Dz, Dzs, E=É, F, G, Gy, H, I=Í, J, K, L, Ly, M, N, Ny, O=Ó, Ö=✖, P, Q, R, S, S, Sz, T, Ty, U=Ú, Ü=justificando, V, W, X, Y, Y, Zfore, Z, Z, Z, Z. dz y dzs no se consideraron letras individuales para la colación, sino dos letras cada, d+z y d+zs en su lugar.) Significa eso, por ejemplo. nádcukor debe preceder nádcsomó (aunque s normalmente precede u), desde c precedes c en la colilación. La diferencia en la longitud de la vocal sólo debe tenerse en cuenta si las dos palabras son de otra manera idénticas (por ejemplo. egér, éger). Los espacios e hipnosis dentro de las frases son ignorados en la colilación. Ch también ocurre como un digraph en ciertas palabras, pero no se considera como un grafima por derecho propio en términos de colación.
- Una característica particular de la colación húngara es que las formas contratadas de doble di- y trigraphs (como Perrito desde gy + gy o ddzs desde dzs + dzs) debe ser collado como si estuvieran escritos en su totalidad (independientemente del hecho de la contracción y los elementos de los di- o trigraphs). Por ejemplo, kaszinó debe preceder kassza (aunque el cuarto personaje z normalmente vendría después s en el alfabeto), porque el cuarto "caracter" (grapheme) de la palabra kassza se considera un segundo sz (decompuestos ssz en sz + sz), que sigue i (en kaszinó).
- En islandés, se añade, y D es seguido por Ð. Cada vocal (A, E, I, O, U, Y) es seguido por su corresponsal con agudo: Á, É, Í, Ó, Ú, í. No hay Z, por lo que el alfabeto termina:... X, Y, Í, À, È, Ö.
- Ambas cartas también fueron utilizadas por los escribas anglosajones que también utilizaron la letra runica Wynn para representar /w/.
- También es una carta de Runic.
- Ð (llamado eth; minúscula ð) es la letra D con un golpe añadido.
- Kiowa se ordena sobre principios fonéticos, como los scripts Brahmic, en lugar de sobre el orden latino histórico. Las voallas vienen primero, luego detiene los consonantes ordenados desde la parte delantera hasta la parte posterior de la boca, y desde el tiempo negativo hasta el inicio de la voz positivo, luego los africatos, fricativos, líquidos y nasales:
- A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
- En lituano, las cartas específicamente lituanas van tras sus originales latinos. Otro cambio es que Y viene justo antes de J:... G, H, I, altitud, Y, J, K...
- En polaco, las letras específicamente polacas derivadas del alfabeto latino se agrupan después de sus originales: A,., B, C, Ć, D, E, İ,..., L, Ł, M, N, Ń, O, Ó, P,..., S, Ś, T,..., Z, Г, Ż. Los digraphs para fines de colación se tratan como si fueran dos letras separadas.
- En portugués, la orden de cocción es como en inglés: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, V, W, X, Y, Z. Los gráficos y letras con diacríticos no están incluidos en el alfabeto.
- En rumano, caracteres especiales derivados del alfabeto latino se collan después de sus originales: A,,,..., I, Î,..., S, Ș, T,,,,,,, Z.
- En los idiomas serbio-croata y otros lenguajes eslavos del Sur, los cinco caracteres acentuados y tres personajes reunidos se clasifican después de los originales:..., C, Č, Ć, D, DŽ, Đ, E,..., L, LJ, M, N, NJ, O,..., S, Š, T,..., Z, Ž.
- Español tratado (hasta 1994) "CH" y "LL" como letras individuales, dando un pedido de Cinco, credo, chispa y Lomo, luz, llama. Esto ya no es cierto, ya que en 1994 la RAE adoptó el uso más convencional, y ahora LL se colló entre LK y LM, y CH entre CG y CI. Los seis personajes con diacríticos Á, É, Í, Ó, Ú, Ü son tratados como las letras originales A, E, I, O, U, por ejemplo: radio, ráfaga, rana, rápido rápido rápido rápido, rastrillo. La única pregunta de collating en español es Ñ (eñe) como una carta diferente colló después de N.
- En el alfabeto sueco hay tres vocales adicionales colocadas al final (..., X, Y, Z, Å, Ä, Ö), similares alfabeto danés y noruego, pero con diferentes glifos y una orden de collación diferente. La letra "W" ha sido tratada como una variante de "V", pero en la 13a edición de Svenska Akademiens ordlista (2006) "W" se consideró una carta separada.
- En el alfabeto turco hay seis letras adicionales: ç, ğ, ı, ö, ş, y ü (pero no q, w, y x). Están collados con ç después c, ğ después g, ı antes I, ö after o, ş after s, and ü after u. Originalmente, cuando el alfabeto fue introducido en 1928, ı fue collado después de i, pero el orden fue cambiado más tarde para que las letras con formas que contienen puntos, cedilles u otras marcas de adorno sigan siempre las letras con formas desnudas correspondientes. Tenga en cuenta que en la ortografía turca la letra I es la majuscule de dotless ı, mientras que İ es la majuscule de dotted i.
- En muchos idiomas turcos (como Azeri o la ortografía Jaꞑalif para el tártaro), solía haber la letra Gha (Ƣƣ), que venía entre G y H. Ahora está en desuso.
- En vietnamita, hay siete cartas adicionales: ă, â, đ, ê, ô, OLD, mientras que f, j, w, z están ausentes, aunque todavía están en algún uso (como la dirección de Internet, el lenguaje de préstamo extranjero). "f" es reemplazado por la combinación "ph". Lo mismo que "w" es "qu".
- En Volapük ä, ö y ü se cuentan como letras separadas y se collaron por separado (a, ä, b... o, ö, p... u, ü, v) mientras q y w están ausentes.
- En Welsh los digraphs CH, DD, FF, NG, LL, PH, RH y TH se tratan como letras individuales, y cada uno se enumera después del primer carácter del par (excepto para NG que aparece después de G), produciendo el orden A, B, C, CH, D, DD, E, F, FF, G, NG, H, etc. A veces puede suceder, sin embargo, que la palabra composición resulta en la yuxtaposición de dos letras que sí no formar un digraph. Un ejemplo es la palabra LLONGYFARCH (compuesta por LLON + GYFARCH). Esto resulta en un pedido como, por ejemplo, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG es un digraph en LLONG, pero no en LLONGYFARCH). La combinación de letras R+H (a diferencia del digraph RH) puede igualmente surgir por la yuxtaposición en compuestos, aunque esto tiende a no producir ningún par en el que la identificación errónea podría afectar el orden. Para las otras combinaciones de letras potencialmente confusas que pueden ocurrir – es decir, D+D y L+L – un hifeno se utiliza en la ortografía (por ejemplo, AD-DAL, CHWIL-LYS).
- En orden alfabético Pinyin, para dos caracteres chinos con las mismas letras básicas de pinyin, si hay una diferencia de letra básica "e" y letra modificada "ê", o de letra básica "u" y letra modificada "ü", entonces el pinyin con una letra modificada viene después de la pinyin sin una letra modificada. Por ejemplo, "額 (è)欸(ê̄)", "directo(lù)驢" (l margen)","n(n explícita) texto (nǚ). Los caracteres de las mismas letras de pinyin (incluyendo letras modificadas ê y ü.) se organizan de acuerdo a sus tonos en el orden de "primero tono (es decir, "flat tone"), segundo tono (rising tone), tercer tono (falling-rising tone), cuarto tono (falling tone), quinto tono (neutral tono)", como "(mā)
Automatización
Los algoritmos de clasificación (en combinación con algoritmos de clasificación) se utilizan en programación informática para colocar cadenas en orden alfabético. Un ejemplo estándar es el algoritmo de intercalación Unicode, que se puede utilizar para colocar cadenas que contengan cualquier símbolo Unicode en (una extensión de) orden alfabético. Se puede hacer que cumpla con la mayoría de las convenciones específicas del idioma descritas anteriormente adaptando su tabla de clasificación predeterminada. Varias de estas adaptaciones se recopilan en el repositorio de datos locales comunes.
Pedidos similares
El principio detrás del orden alfabético todavía se puede aplicar en idiomas que no usan estrictamente un alfabeto (por ejemplo, pueden escribirse usando un silabario o abugida) siempre que los símbolos utilizados tengan un orden establecido.
Para los sistemas de escritura logográfica, como el hanzi chino o el kanji japonés, el método de clasificación por radicales y trazos se utiliza con frecuencia como una forma de definir un orden en los símbolos. El japonés a veces usa el orden de pronunciación, más comúnmente con el orden Gojūon pero a veces con el orden más antiguo Iroha.
En matemáticas, el orden lexicográfico es un medio para ordenar secuencias de una manera análoga a la utilizada para producir el orden alfabético.
Algunas aplicaciones informáticas utilizan una versión del orden alfabético que se puede lograr mediante un algoritmo muy simple, basado exclusivamente en códigos ASCII o Unicode para caracteres. Esto puede tener efectos no estándar, como colocar todas las letras mayúsculas antes que las minúsculas. Ver orden ASCIIbético.
Un diccionario de rimas se basa en ordenar las palabras en orden alfabético comenzando desde la última hasta la primera letra de la palabra.