Escritura tamil
La escritura tamil (தமிழ் அரிச்சுவடி Tamiḻ ariccuvaṭi [tamiɻ ˈaɾitːɕuʋaɽi], ⓘ) es una escritura abugida que utilizan los tamiles y los hablantes de tamil en India, Sri Lanka, Malasia, Singapur, Indonesia y otros lugares para escribir el idioma tamil. Es una de las escrituras oficiales de la República India. Ciertas lenguas minoritarias como Saurashtra, Badaga, Irula y Paniya también están escritas en escritura tamil.
Características
La escritura tamil tiene 12 vocales (உயிரெழுத்து, uyireḻuttu, "letras del alma"), 18 consonantes ( மெய்யெழுத்து, meyyeḻuttu, "body-letters") y un carácter especial, el ஃ (ஆய்த எழுத்து, āytha eḻuttu). ஃ se llama "அக்கு", akku y está clasificado en la ortografía tamil no es ni consonante ni vocal. Sin embargo, aparece al final del conjunto de vocales. La escritura es silábica, no alfabética. La escritura completa, por lo tanto, consta de 31 letras en sus formas independientes y 216 letras combinatorias adicionales, para un total de 247 (12+18+216+1) combinaciones (உயிர்மெய்யெழுத்து, uyirmeyyeḻuttu, "alma-cuerpo-letras") de una consonante y una vocal, una consonante muda o una vocal sola. Las letras combinatorias se forman añadiendo un marcador vocal a la consonante. Algunas vocales requieren que la forma básica de la consonante se modifique de una manera específica para esa vocal. Otras se escriben agregando un sufijo específico de una vocal a la consonante, otras un prefijo y otras vocales requieren agregar un prefijo y un sufijo a la consonante. En todos los casos, el marcador vocal es diferente del carácter independiente de la vocal.
La escritura tamil se escribe de izquierda a derecha.
Historia
Se cree que la escritura tamil, al igual que las otras escrituras brahmicas, evolucionó a partir de la escritura brahmi original. Las primeras inscripciones que son ejemplos aceptados de escritura tamil datan del período Ashokan. La escritura utilizada en tales inscripciones se conoce comúnmente como tamil-brahmi o "escritura tamili". y difiere en muchos aspectos del Ashokan Brahmi estándar. Por ejemplo, el antiguo tamil-brahmi, a diferencia del Ashokan Brahmi, tenía un sistema para distinguir entre consonantes puras (m, en este ejemplo) y consonantes con una vocal inherente (ma, en este ejemplo). Además, según Iravatham Mahadevan, los primeros tamil brahmi usaban marcadores vocales ligeramente diferentes, tenían caracteres adicionales para representar letras que no se encontraban en sánscrito y omitían letras para sonidos que no estaban presentes en tamil, como consonantes sonoras y aspirados. Las inscripciones del siglo II utilizan una forma posterior de tamil-brahmi, que es sustancialmente similar al sistema de escritura descrito en el Tolkāppiyam, una antigua gramática tamil. En particular, utilizaron el puḷḷi para suprimir la vocal inherente. A partir de entonces, las letras tamiles evolucionaron hacia una forma más redondeada y, en el siglo V o VI, habían alcanzado una forma llamada primero vaṭṭeḻuttu.
Sin embargo, la escritura tamil moderna no desciende de esa escritura. En el siglo IV, la dinastía Pallava creó una nueva escritura llamada escritura Pallava para tamil y el alfabeto Grantha evolucionó a partir de ella, agregando el alfabeto Vaṭṭeḻuttu para los sonidos que no se encuentran en la escritura sánscrita. Paralelamente al alfabeto Grantha, surgió nuevamente en los territorios de Pallava y Chola una nueva escritura (escritura Chola-Pallava, que evolucionó a la escritura tamil moderna) que se asemeja al mismo desarrollo de glifos que Grantha, sin embargo, muy reducida en sus formas y sin superar a los sonidos tamiles no nativos.. En el siglo VIII, las nuevas escrituras suplantaron a Vaṭṭeḻuttu en los reinos Pallava y Chola que se encontraban en la parte norte de la región de habla tamil. Sin embargo, Vaṭṭeḻuttu continuó utilizándose en la parte sur de la región de habla tamil, en los reinos de Chera y Pandyan hasta el siglo XI, cuando el reino de Pandyan fue conquistado por los Cholas, quienes heredaron siendo feudatarios de Pallavas por un corto tiempo.
Con la caída del reino de Pallava, la dinastía Chola impulsó la escritura Chola-Pallava como la escritura de facto. Durante los siglos siguientes, la escritura chola-pallava evolucionó hasta convertirse en la escritura tamil moderna. El Grantha y su escritura original influyeron notablemente en la escritura tamil. El uso de hojas de palma como medio principal para escribir provocó cambios en la escritura. El escriba tenía que tener cuidado de no perforar las hojas con el lápiz mientras escribía porque una hoja con un agujero tenía más probabilidades de romperse y pudrirse más rápido. Como resultado, el uso de puḷḷi para distinguir consonantes puras se volvió raro, y las consonantes puras generalmente se escribían como si la vocal inherente estuviera presente. De manera similar, el marcador vocal (ஃ) llamado: Tamil: குற்றியலுகரம், romanizado: kuṟṟiyal-ukaram, lit. 'short 'u'-loud', una u semicircular que aparece al final de algunas palabras y en la posición media en ciertas Las palabras compuestas, que marcan un sonido u abreviado, también dejaron de usarse y fueron reemplazadas por el marcador para el u simple ( ு). El puḷḷi (ஂ) no reapareció por completo hasta la introducción de la imprenta, pero el marcador kuṟṟiyal-ukaram ( ஃ) nunca volvió a utilizarse con este propósito, aunque su uso se conserva en ciertas palabras conceptuales gramaticales, mientras que el sonido en sí todavía existe y juega un papel importante en la prosodia tamil..
Las formas de algunas de las letras se simplificaron en el siglo XIX para que la escritura fuera más fácil de escribir. En el siglo XX, la escritura se simplificó aún más con una serie de reformas que regularizaron los marcadores vocálicos utilizados con consonantes eliminando marcadores especiales y la mayoría de las formas irregulares.
relación con otros scripts indic
El script tamil difiere de otros scripts derivados de Brahmi de varias maneras. A diferencia de cualquier otra escritura brahmic, no representa regularmente consonantes de parada con voz o aspirada, ya que estos no son fonemas del lenguaje tamil a pesar de que los alófonos de paradas expresados y fricativos aparecen en el tamil hablado. Por lo tanto, el personaje க் k , por ejemplo, representa /k/ pero también se puede pronunciar [ g ] o [ x ] basado en las reglas de la gramática tamil. Aparece un conjunto separado de caracteres para estos sonidos cuando el script tamil se usa para escribir sánscrito u otros idiomas.
También a diferencia de otros guiones Brahmi, el script tamil rara vez usa ligaduras tipográficas para representar consonantes conjuntas, que son mucho menos frecuentes en tamil que en otros idiomas indios. Cuando ocurren, las consonantes conjuntas se escriben escribiendo el personaje para la primera consonante, agregando la puḷḷi para suprimir su vocal inherente y luego escribir el personaje para la segunda consonante. Hay algunas excepciones, a saber க்ஷ kṣa y ஶ்ரீ śrī .
ISO 15919 es un estándar internacional para la transliteración de tamil y otros guiones indic en caracteres latinos. Utiliza diacríticos para mapear el conjunto mucho más grande de consonantes y vocales brahmicas al guión latino.
letras
Consonantes básicas
Las consonantes se llaman "cuerpo" (mei) letras. Las consonantes se clasifican en tres categorías: vallinam (consonantes duras), mellinam (consonantes suaves, incluidas todas las nasales) y itayinam (consonantes medias).).
Existen algunas reglas léxicas para la formación de palabras. El Tolkāppiyam describe tales reglas. Algunos ejemplos: una palabra no puede terminar en ciertas consonantes y no puede comenzar con algunas consonantes, incluidas r-, l- y ḻ-; Hay seis consonantes nasales en tamil: una nasal velar ங், una nasal palatina ஞ், una nasal retrofleja ண், una nasal dental ந், una nasal bilabial ம் y una nasal alveolar ன்.
El orden del alfabeto (estrictamente abugida) en tamil coincide estrechamente con el de las lenguas cercanas tanto en ubicación como en lingüística, lo que refleja el origen común de sus escrituras en brahmi.
El idioma tamil tiene 18 consonantes: mey eluttukkal. Los gramáticos tradicionales han clasificado estas 18 en tres grupos de 6 letras cada uno. Esta clasificación se realiza en función del método de articulación y, por tanto, de la naturaleza de estas letras. Vallinam (grupo duro), Mellinam (grupo blando) y idaiyinam (grupo medio). Todas las consonantes se pronuncian durante media unidad (māttirai) cuando están aisladas (las consonantes combinadas con vocales se pronunciarán con la duración de la vocal).
Consonant | ISO 15919 | Categoría | IPA |
---|---|---|---|
க் | k | vallinam | /k/ |
ங் | ṅ | mellinam | // |
ச் | c | vallinam | - No. s/ |
ஞ் | ñ | mellinam | /ɲ/ |
ட் | ► | vallinam | /ʈ/ |
ண் | . | mellinam | /ɳ/ |
த் | t | vallinam | /t̪/ |
ந் | n | mellinam | /n̪/ |
ப் | p | vallinam | /p/ |
ம் | m | mellinam | /m/ |
ய் | Sí. | idaiyinam | /j/ |
ர் | r | idaiyinam | // |
ல் | l | idaiyinam | /l/ |
வ் | v | idaiyinam | /ʋ/ |
ழ் | ḻ | idaiyinam | /ɻ/ |
ள் | . | idaiyinam | /ɭ/ |
ற் | . | vallinam | /r/ |
ன் | ṉ | mellinam | [n] |
Consonantes adicionales utilizadas en tamil
El habla tamil ha incorporado muchos fonemas que no formaban parte de la clasificación Tolkāppiyam. Las letras utilizadas para escribir estos sonidos, conocidas como Grantha, se utilizan como parte del tamil. Estos se enseñan desde la escuela primaria y se incorporan a la codificación de todos los caracteres tamil (TACE16).
Consonant | ISO 15919 | IPA |
---|---|---|
ஜ் | j | /d |
ஶ் | ś | / |
ஷ் | . | /ʂ/ |
ஸ் | s | /s/ |
ஹ் | h | /h/ |
க்ஷ் | k | /kʂ/ |
También existe el compuesto ஶ்ரீ (śrī), equivalente a श्री</span en devanagari.
En los últimos tiempos, combinaciones de consonantes con ஃ ( ஆய்த எழுத்து, āyda eḻuttu , equivalente a nuqta) se utilizan generalmente para representar fonemas de lenguas extranjeras, especialmente para escribir textos islámicos y cristianos. Por ejemplo: asif = அசிஃப், azārutīn̠ = அஃஜாருதீன், Genghis Khan = கெங்கிஸ் ஃகான்.
Adaptado Tamil | ISO 15919 | Perso-Arabic | Devanagari |
---|---|---|---|
ஃஜ | za | ز | . |
ஃக | xa | POLÍTICA | ख़ |
ஃப | fa | ف | फ़ |
ஃவ | wa | و | व़ |
ஃஷ | ža | Descubrir | झ़ |
ஃஸ | s̤a | . | RAS़ |
ஃஹ | h̤ | ح | . |
ஃத | t̤ | . | त |
se usa un diacrítico similar a Nuqta mientras se escribe el lenguaje Badaga y el doble punto nuqta para que el idioma Irula transcriba sus sonidos.
También ha habido un esfuerzo para diferenciar las consonantes con voz y sin voz a través de números suscritos: dos, tres y cuatro que representan a los aspirados, expresados, expresados con aspiración ruidosos respectivamente. Esto se usó para transcribir palabras sánscritas en libros sánscritos -tamil, como se muestra en la tabla a continuación.
க ka | க2 kha | க3 ga | க4 gha |
ச ca | ச2 # | ஜ ja | ஜ2 jha |
ட ►a | ட2 Åha | ட3 GERA | ட4 TORH |
த ta | த2 tha | த3 da | த4 ♪ |
ப pa | ப2 pha | ப3 ba | ப4 bha |
El estándar Unicode utiliza dígitos en superíndice para el mismo propósito, como en ப² pha, ப³ ba y ப⁴ bha</i .
Vocales
Las vocales también se llaman vocales 'vida' (uyir) o 'alma' letras. Junto con las consonantes (mei, que se llaman letras 'cuerpo'), forman letras compuestas, silábicas (abugida) que se denominan letras 'vivas'. o 'encarnado' letras (uyir mei, es decir, letras que tienen tanto 'cuerpo' como 'alma').
Las vocales tamiles se dividen en cortas y largas (cinco de cada tipo) y dos diptongos.
Independiente | Vowel sign | ISO 15919 | IPA |
---|---|---|---|
அ | — | a | / |
ஆ | ா | ā | /a Capital |
இ | ி | i | /i/ |
ஈ | ீ | . | /i Ambiental/ |
உ | ு | u | /u/ |
ஊ | ூ | ū | /u |
எ | ெ | e | /e/ |
ஏ | ே | ē | /e Male/ |
ஐ | ை | ai | / |
ஒ | ொ | o | /o/ |
ஓ | ோ | ō | /o Ambiental/ |
ஔ | ௌ | au | / |
Forma compuesta
Did you mean:Using the consonant n#39;' as an example:
Formación | Forma compuesta | ISO 15919 | IPA |
---|---|---|---|
க் + அ | க | ka | /k capitalista/ |
க் + ஆ | கா | kā | /ka saque/ |
க் + இ | கி | # | /ki/ |
க் + ஈ | கீ | kī | /ki |
க் + உ | கு | ku | /ku/ |
க் + ஊ | கூ | kū | /ku saque/ |
க் + எ | கெ | ke | /ke/ |
க் + ஏ | கே | kē | /ke bancario/ |
க் + ஐ | கை | kai | /k escapari |
க் + ஒ | கொ | ko | /ko/ |
க் + ஓ | கோ | kō | /ko%/ |
க் + ஔ | கௌ | kau | /k escaparu |
La letra especial ஃ, representada por tres puntos y llamada āyta eḻuttu o aḵ. Originalmente representaba una retención arcaica en tamil del sonido dravídico ḥ, que se ha perdido en casi todas las lenguas dravídicas modernas, y en tamil tradicionalmente cumple una función puramente gramatical, pero en los tiempos modernos se ha llegado a utilizar como diacrítico para representar lengua extranjera. sonidos. Por ejemplo, ஃப se usa para el sonido inglés f, que no se encuentra en tamil.. También sirvió antes de que las hojas de palma se convirtieran en el principal medio de escritura para palabras que terminaban con una vocal consonante inherente u como regla de pronunciación para una u corta, llamada – Tamil: குற்றியலுகரம், romanizado: kuṟṟiyal -ukaram, lit. 'corto 'u'-fuerte'. Las siguientes consonantes representaron este comportamiento: கு, சு, டு, து, பு, று. En lugar de escribir como en la actualidad sin marcadores, por ejemplo (tamil: அது, romanizado: Atu), fue escrito con un ஃ, como – Tamil: அஃது, romanizado: Aḥtu.
Otra letra tamil arcaica ஂ, representada por un pequeño círculo hueco y llamada Aṉuvara, es el Anusvara. Se usaba tradicionalmente como nasal homorgánica delante de una consonante y como nasal bilabial (m) o nasal alveolar (n) al final de una palabra, según el contexto.
Las vocales largas (nedil) son aproximadamente el doble de largas que las vocales cortas. (kuṟil) vocales. Los diptongos generalmente se pronuncian aproximadamente una vez y media más largos que las vocales cortas, aunque algunos textos gramaticales los colocan con la larga (nedil) vocales.
Como se puede observar en la forma compuesta, el signo vocálico se puede añadir a la derecha, a la izquierda o a ambos lados de las consonantes. También puede formar una ligadura. Estas reglas están evolucionando y el uso antiguo tiene más ligaduras que el uso moderno. Lo que realmente ve en esta página depende de su selección de fuente; por ejemplo, Code2000 mostrará más ligaduras que Latha.
Hay defensores de la reforma de la escritura que quieren eliminar todas las ligaduras y dejar que todos los signos vocales aparezcan en el lado derecho.
Unicode codifica el carácter en orden lógico (siempre la consonante primero), mientras que las codificaciones heredadas de 8 bits (como TSCII) prefieren el orden escrito. Esto hace que sea necesario reordenar al convertir de una codificación a otra; no es suficiente simplemente asignar un conjunto de puntos de código a otro.
Tabla compuesta de letras tamiles
La siguiente tabla enumera las letras vocales (uyir o vida) en la parte superior. y consonantes (mei o cuerpo) a lo largo del costado, cuya combinación da todas las letras compuestas tamil (uyirmei).
Tolkāppiyam consonantes | Vowels | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∅
a | ா
ā | ி i | ீ . | ு u | ூ ū | ெ e | ே ē | ை ai | ொ o | ோ ō | ௌ au | ||
∅ (Independiente) | அ | ஆ | இ | ஈ | உ | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | |
க் | k | க | கா | கி | கீ | கு | கூ | கெ | கே | கை | கொ | கோ | கௌ |
ங் | ṅ | ங | ஙா | ஙி | ஙீ | ஙு | ஙூ | ஙெ | ஙே | ஙை | ஙொ | ஙோ | ஙௌ |
ச் | c | ச | சா | சி | சீ | சு | சூ | செ | சே | சை | சொ | சோ | சௌ |
ஞ் | ñ | ஞ | ஞா | ஞி | ஞீ | ஞு | ஞூ | ஞெ | ஞே | ஞை | ஞொ | ஞோ | ஞௌ |
ட் | ► | ட | டா | டி | டீ | டு | டூ | டெ | டே | டை | டொ | டோ | டௌ |
ண் | . | ண | ணா | ணி | ணீ | ணு | ணூ | ணெ | ணே | ணை | ணொ | ணோ | ணௌ |
த் | t | த | தா | தி | தீ | து | தூ | தெ | தே | தை | தொ | தோ | தௌ |
ந் | n | ந | நா | நி | நீ | நு | நூ | நெ | நே | நை | நொ | நோ | நௌ |
ப் | p | ப | பா | பி | பீ | பு | பூ | பெ | பே | பை | பொ | போ | பௌ |
ம் | m | ம | மா | மி | மீ | மு | மூ | மெ | மே | மை | மொ | மோ | மௌ |
ய் | Sí. | ய | யா | யி | யீ | யு | யூ | யெ | யே | யை | யொ | யோ | யௌ |
ர் | r | ர | ரா | ரி | ரீ | ரு | ரூ | ரெ | ரே | ரை | ரொ | ரோ | ரௌ |
ல் | l | ல | லா | லி | லீ | லு | லூ | லெ | லே | லை | லொ | லோ | லௌ |
வ் | v | வ | வா | வி | வீ | வு | வூ | வெ | வே | வை | வொ | வோ | வௌ |
ழ் | ḻ | ழ | ழா | ழி | ழீ | ழு | ழூ | ழெ | ழே | ழை | ழொ | ழோ | ழௌ |
ள் | . | ள | ளா | ளி | ளீ | ளு | ளூ | ளெ | ளே | ளை | ளொ | ளோ | ளௌ |
ற் | . | ற | றா | றி | றீ | று | றூ | றெ | றே | றை | றொ | றோ | றௌ |
ன் | ṉ | ன | னா | னி | னீ | னு | னூ | னெ | னே | னை | னொ | னோ | னௌ |
Grantha consonantes | Vowels | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∅
a | ா
ā | ி i | ீ . | ு u | ூ ū | ெ e | ே ē | ை ai | ொ o | ோ ō | ௌ au | ||
ஶ் | ś | ஶ | ஶா | ஶி | ஶீ | ஶு | ஶூ | ஶெ | ஶே | ஶை | ஶொ | ஶோ | ஶௌ |
ஜ் | j | ஜ | ஜா | ஜி | ஜீ | ஜு | ஜூ | ஜெ | ஜே | ஜை | ஜொ | ஜோ | ஜௌ |
ஷ் | . | ஷ | ஷா | ஷி | ஷீ | ஷு | ஷூ | ஷெ | ஷே | ஷை | ஷொ | ஷோ | ஷௌ |
ஸ் | s | ஸ | ஸா | ஸி | ஸீ | ஸு | ஸூ | ஸெ | ஸே | ஸை | ஸொ | ஸோ | ஸௌ |
ஹ் | h | ஹ | ஹா | ஹி | ஹீ | ஹு | ஹூ | ஹெ | ஹே | ஹை | ஹொ | ஹோ | ஹௌ |
க்ஷ் | k | க்ஷ | க்ஷா | க்ஷி | க்ஷீ | க்ஷு | க்ஷூ | க்ஷெ | க்ஷே | க்ஷை | க்ஷொ | க்ஷோ | க்ஷௌ |
Orden de escritura
Carta | Animación |
---|---|
a) | |
ஆ (ā) | |
i) | |
ஈ (ī) | |
உ (u) | |
ū (ū) | |
e) | |
ஏ (ē) | |
ஐ (ai) | |
ஒ (o) | |
ō (ō) | |
ஔ (au) | |
ஃ (aḵ)* | |
* aytam pero tradicionalmente agrupado con las cartas vocales. |
Carta | Animación |
---|---|
k) | |
ங் (ṅ) | |
c) | |
ஞ் (ñ) | |
ட் (ṭ) | |
ṇ () | |
த் (t) | |
n) | |
ப் (p) | |
m) | |
ய் (y) | |
ர் (r) | |
l) | |
v) | |
ழ் (ḻ) | |
ள் ( | |
ற் (Sí) | |
ன் (ṉ) |
Números y símbolos
Además de los números habituales (del 0 al 9), el tamil también tiene números para 10, 100 y 1000. También se pueden encontrar símbolos para fracciones y otros conceptos basados en números.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 100 | 1000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
௦ | ௧ | ௨ | ௩ | ௪ | ௫ | ௬ | ௭ | ௮ | ௯ | ௰ | ௱ | ௲ |
día | mes | año | debit | crédito | arriba | rupias | numeral | tiempo | cantidad |
---|---|---|---|---|---|---|---|---|---|
௳ | ௴ | ௵ | ௶ | ௷ | ௸ | ௹ | ௺ | ள | வ |
Unicode
La escritura tamil se agregó al estándar Unicode en octubre de 1991 con el lanzamiento de la versión 1.0.0. El bloque Unicode para tamil es U+0B80–U+0BFF. Las áreas grises indican puntos de código no asignados. La mayoría de los puntos de código no asignados se designan reservados porque están en la misma posición relativa que los caracteres asignados en otros bloques de escritura del sur de Asia que corresponden a fonemas que no existen en la escritura tamil.
Se han realizado esfuerzos para unificar la escritura Grantha con el tamil; sin embargo, las propuestas provocaron el descontento de algunos. Finalmente, considerando la sensibilidad involucrada, se determinó que las dos escrituras debían codificarse de forma independiente, excepto los números.
Tamil Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0B8x | ஂ | ஃ | அ | ஆ | இ | ஈ | உ | ஊ | எ | ஏ | ||||||
U+0B9x | ஐ | ஒ | ஓ | ஔ | க | ங | ச | ஜ | ஞ | ட | ||||||
U+0BAx | ண | த | ந | ன | ப | ம | ய | |||||||||
U+0BBx | ர | ற | ல | ள | ழ | வ | ஶ | ஷ | ஸ | ஹ | ா | ி | ||||
U+0BCx | ீ | ு | ூ | ெ | ே | ை | ொ | ோ | ௌ | ் | ||||||
U+0BDx | ௐ | ௗ | ||||||||||||||
U+0BEx | ௦ | ௧ | ௨ | ௩ | ௪ | ௫ | ௬ | ௭ | ௮ | ௯ | ||||||
U+0BFx | ௰ | ௱ | ௲ | ௳ | ௴ | ௵ | ௶ | ௷ | ௸ | ௹ | ௺ | |||||
Notas
|
Se presentaron propuestas para codificar los caracteres utilizados para valores fraccionarios en las prácticas contables tradicionales. Aunque la ICTA de Sri Lanka la desalentó, la propuesta fue reconocida por el Gobierno de Tamil Nadu y se agregó al estándar Unicode en marzo de 2019 con el lanzamiento de la versión 12.0. El bloque Unicode para el suplemento tamil es U+11FC0–U+11FFF:
Suplemento Tamil Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+11FCx | 𑿀 | 𑿁 | 𑿂 | 𑿃 | 𑿄 | 𑿅 | 𑿆 | 𑿇 | 𑿈 | 𑿉 | 𑿊 | 𑿋 | 𑿌 | 𑿍 | 𑿎 | 𑿏 |
U+11FDx | 𑿐 | 𑿑 | 𑿒 | 𑿓 | 𑿔 | 𑿕 | 𑿖 | 𑿗 | 𑿘 | 𑿙 | 𑿚 | 𑿛 | 𑿜 | 𑿝 | 𑿞 | 𑿟 |
U+11FEx | 𑿠 | 𑿡 | 𑿢 | 𑿣 | 𑿤 | 𑿥 | 𑿦 | 𑿧 | 𑿨 | 𑿩 | 𑿪 | 𑿫 | 𑿬 | 𑿭 | 𑿮 | 𑿯 |
U+11FFx | 𑿰 | 𑿱 | 𑿿 | |||||||||||||
Notas
|
Silabario
Al igual que otros scripts del sur asiático en Unicode, la codificación Tamil se derivaba originalmente del estándar ISCII. Tanto ISCII como Unicode codifican Tamil como abugida. En una abugida, cada personaje básico representa una vocal consonante y predeterminada. Los consonantes con una vocal diferente o consonantes desnudos están representados agregando un carácter modificador a un personaje base. Cada punto de código que representa un teléfono similar está codificado en la misma posición relativa en cada bloque de script del sur asiático en Unicode, incluyendo Tamil. Debido a que Unicode representa Tamil como abugida todos los consonantes puros (consonantes sin vocal asociada) y sílabas en Tamil pueden ser representados combinando múltiples puntos de código Unicode, como se puede ver en el Unicode Tamil Syllabary abajo. En Unicode 5.1, se agregaron secuencias llamadas para todos los consonantes Tamil y sílabas.
Unicode 5.1 también tiene una secuencia con nombre para la ligadura tamil SRI (śrī), ஶ்ரீ, escrita usando ஶ (śa). El nombre de esta secuencia es TAMIL SYLLABLE SHRII y está compuesta por la secuencia Unicode U+0BB6 U+0BCD U+0BB0 U+0BC0. La ligadura también se puede escribir usando ஸ (sa) para crear una ligadura idéntica ஸ்ரீ compuesta por la secuencia Unicode U+0BB8 U+0BCD U+0BB0 U+0BC0; pero el estándar Unicode desaconseja esto.
Consonants | Vowels | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
அ 0B85 | ஆ 0B86 | இ 0B87 | ஈ 0B88 | உ 0B89 | ஊ 0B8A | எ 0B8E | ஏ 0B8F | ஐ 0B90 | ஒ 0B92 | ஓ 0B93 | ஔ 0B94 | |
க் 0B95 0BCD | க 0B95 | கா 0B95 0BBE | கி 0B95 0BBF | கீ 0B95 0BC0 | கு 0B95 0BC1 | கூ 0B95 0BC2 | கெ 0B95 0BC6 | கே 0B95 0BC7 | கை 0B95 0BC8 | கொ 0B95 0BCA | கோ 0B95 0BCB | கௌ 0B95 0BCC |
ங் 0B99 0BCD | ங 0B99 | ஙா 0B99 0BBE | ஙி 0B99 0BBF | ஙீ 0B99 0BC0 | ஙு 0B99 0BC1 | ஙூ 0B99 0BC2 | ஙெ 0B99 0BC6 | ஙே 0B99 0BC7 | ஙை 0B99 0BC8 | ஙொ 0B99 0BCA | ஙோ 0B99 0BCB | ஙௌ 0B99 0BCC |
ச் 0B9A 0BCD | ச 0B9A | சா 0B9A 0BBE | சி 0B9A 0BBF | சீ 0B9A 0BC0 | சு 0B9A 0BC1 | சூ 0B9A 0BC2 | செ 0B9A 0BC6 | சே 0B9A 0BC7 | சை 0B9A 0BC8 | சொ 0B9A 0BCA | சோ 0B9A 0BCB | சௌ 0B9A 0BCC |
ஞ் 0B9E 0BCD | ஞ 0B9E | ஞா 0B9E 0BBE | ஞி 0B9E 0BBF | ஞீ 0B9E 0BC0 | ஞு 0B9E 0BC1 | ஞூ 0B9E 0BC2 | ஞெ 0B9E 0BC6 | ஞே 0B9E 0BC7 | ஞை 0B9E 0BC8 | ஞொ 0B9E 0BCA | ஞோ 0B9E 0BCB | ஞௌ 0B9E 0BCC |
ட் 0B9F 0BCD | ட 0B9F | டா 0B9F 0BBE | டி 0B9F 0BBF | டீ 0B9F 0BC0 | டு 0B9F 0BC1 | டூ 0B9F 0BC2 | டெ 0B9F 0BC6 | டே 0B9F 0BC7 | டை 0B9F 0BC8 | டொ 0B9F 0BCA | டோ 0B9F 0BCB | டௌ 0B9F 0BCC |
ண் 0BA3 0BCD | ண 0BA3 | ணா 0BA3 0BBE | ணி 0BA3 0BBF | ணீ 0BA3 0BC0 | ணு 0BA3 0BC1 | ணூ 0BA3 0BC2 | ணெ 0BA3 0BC6 | ணே 0BA3 0BC7 | ணை 0BA3 0BC8 | ணொ 0BA3 0BCA | ணோ 0BA3 0BCB | ணௌ 0BA3 0BCC |
த் 0BA4 0BCD | த 0BA4 | தா 0BA4 0BBE | தி 0BA4 0BBF | தீ 0BA4 0BC0 | து 0BA4 0BC1 | தூ 0BA4 0BC2 | தெ 0BA4 0BC6 | தே 0BA4 0BC7 | தை 0BA4 0BC8 | தொ 0BA4 0BCA | தோ 0BA4 0BCB | தௌ 0BA4 0BCC |
ந் 0BA8 0BCD | ந 0BA8 | நா 0BA8 0BBE | நி 0BA8 0BBF | நீ 0BA8 0BC0 | நு 0BA8 0BC1 | நூ 0BA8 0BC2 | நெ 0BA8 0BC6 | நே 0BA8 0BC7 | நை 0BA8 0BC8 | நொ 0BA8 0BCA | நோ 0BA8 0BCB | நௌ 0BA8 0BCC |
ப் 0BAA 0BCD | ப 0BAA | பா 0BAA 0BBE | பி 0BAA 0BBF | பீ 0BAA 0BC0 | பு 0BAA 0BC1 | பூ 0BAA 0BC2 | பெ 0BAA 0BC6 | பே 0BAA 0BC7 | பை 0BAA 0BC8 | பொ 0BAA 0BCA | போ 0BAA 0BCB | பௌ 0BAA 0BCC |
ம் 0BAE 0BCD | ம 0BAE | மா 0BAE 0BBE | மி 0BAE 0BBF | மீ 0BAE 0BC0 | மு 0BAE 0BC1 | மூ 0BAE 0BC2 | மெ 0BAE 0BC6 | மே 0BAE 0BC7 | மை 0BAE 0BC8 | மொ 0BAE 0BCA | மோ 0BAE 0BCB | மௌ 0BAE 0BCC |
ய் 0BAF 0BCD | ய 0BAF | யா 0BAF 0BBE | யி 0BAF 0BBF | யீ 0BAF 0BC0 | யு 0BAF 0BC1 | யூ 0BAF 0BC2 | யெ 0BAF 0BC6 | யே 0BAF 0BC7 | யை 0BAF 0BC8 | யொ 0BAF 0BCA | யோ 0BAF 0BCB | யௌ 0BAF 0BCC |
ர் 0BB0 0BCD | ர 0BB0 | ரா 0BB0 0BBE | ரி 0BB0 0BBF | ரீ 0BB0 0BC0 | ரு 0BB0 0BC1 | ரூ 0BB0 0BC2 | ரெ 0BB0 0BC6 | ரே 0BB0 0BC7 | ரை 0BB0 0BC8 | ரொ 0BB0 0BCA | ரோ 0BB0 0BCB | ரௌ 0BB0 0BCC |
ல் 0BB2 0BCD | ல 0BB2 | லா 0BB2 0BBE | லி 0BB2 0BBF | லீ 0BB2 0BC0 | லு 0BB2 0BC1 | லூ 0BB2 0BC2 | லெ 0BB2 0BC6 | லே 0BB2 0BC7 | லை 0BB2 0BC8 | லொ 0BB2 0BCA | லோ 0BB2 0BCB | லௌ 0BB2 0BCC |
வ் 0BB5 0BCD | வ 0BB5 | வா 0BB5 0BBE | வி 0BB5 0BBF | வீ 0BB5 0BC0 | வு 0BB5 0BC1 | வூ 0BB5 0BC2 | வெ 0BB5 0BC6 | வே 0BB5 0BC7 | வை 0BB5 0BC8 | வொ 0BB5 0BCA | வோ 0BB5 0BCB | வௌ 0BB5 0BCC |
ழ் 0BB4 0BCD | ழ 0BB4 | ழா 0BB4 0BBE | ழி 0BB4 0BBF | ழீ 0BB4 0BC0 | ழு 0BB4 0BC1 | ழூ 0BB4 0BC2 | ழெ 0BB4 0BC6 | ழே 0BB4 0BC7 | ழை 0BB4 0BC8 | ழொ 0BB4 0BCA | ழோ 0BB4 0BCB | ழௌ 0BB4 0BCC |
ள் 0BB3 0BCD | ள 0BB3 | ளா 0BB3 0BBE | ளி 0BB3 0BBF | ளீ 0BB3 0BC0 | ளு 0BB3 0BC1 | ளூ 0BB3 0BC2 | ளெ 0BB3 0BC6 | ளே 0BB3 0BC7 | ளை 0BB3 0BC8 | ளொ 0BB3 0BCA | ளோ 0BB3 0BCB | ளௌ 0BB3 0BCC |
ற் 0BB1 0BCD | ற 0BB1 | றா 0BB1 0BBE | றி 0BB1 0BBF | றீ 0BB1 0BC0 | று 0BB1 0BC1 | றூ 0BB1 0BC2 | றெ 0BB1 0BC6 | றே 0BB1 0BC7 | றை 0BB1 0BC8 | றொ 0BB1 0BCA | றோ 0BB1 0BCB | றௌ 0BB1 0BCC |
ன் 0BA9 0BCD | ன 0BA9 | னா 0BA9 0BBE | னி 0BA9 0BBF | னீ 0BA9 0BC0 | னு 0BA9 0BC1 | னூ 0BA9 0BC2 | னெ 0BA9 0BC6 | னே 0BA9 0BC7 | னை 0BA9 0BC8 | னொ 0BA9 0BCA | னோ 0BA9 0BCB | னௌ 0BA9 0BCC |
ஶ் 0BB6 0BCD | ஶ 0BB6 | ஶா 0BB6 0BBE | ஶி 0BB6 0BBF | ஶீ 0BB6 0BC0 | ஶு 0BB6 0BC1 | ஶூ 0BB6 0BC2 | ஶெ 0BB6 0BC6 | ஶே 0BB6 0BC7 | ஶை 0BB6 0BC8 | ஶொ 0BB6 0BCA | ஶோ 0BB6 0BCB | ஶௌ 0BB6 0BCC |
ஜ் 0B9C 0BCD | ஜ 0B9C | ஜா 0B9C 0BBE | ஜி 0B9C 0BBF | ஜீ 0B9C 0BC0 | ஜு 0B9C 0BC1 | ஜூ 0B9C 0BC2 | ஜெ 0B9C 0BC6 | ஜே 0B9C 0BC7 | ஜை 0B9C 0BC8 | ஜொ 0B9C 0BCA | ஜோ 0B9C 0BCB | ஜௌ 0B9C 0BCC |
ஷ் 0BB7 0BCD | ஷ 0BB7 | ஷா 0BB7 0BBE | ஷி 0BB7 0BBF | ஷீ 0BB7 0BC0 | ஷு 0BB7 0BC1 | ஷூ 0BB7 0BC2 | ஷெ 0BB7 0BC6 | ஷே 0BB7 0BC7 | ஷை 0BB7 0BC8 | ஷொ 0BB7 0BCA | ஷோ 0BB7 0BCB | ஷௌ 0BB7 0BCC |
ஸ் 0BB8 0BCD | ஸ 0BB8 | ஸா 0BB8 0BBE | ஸி 0BB8 0BBF | ஸீ 0BB8 0BC0 | ஸு 0BB8 0BC1 | ஸூ 0BB8 0BC2 | ஸெ 0BB8 0BC6 | ஸே 0BB8 0BC7 | ஸை 0BB8 0BC8 | ஸொ 0BB8 0BCA | ஸோ 0BB8 0BCB | ஸௌ 0BB8 0BCC |
ஹ் 0BB9 0BCD | ஹ 0BB9 | ஹா 0BB9 0BBE | ஹி 0BB9 0BBF | ஹீ 0BB9 0BC0 | ஹு 0BB9 0BC1 | ஹூ 0BB9 0BC2 | ஹெ 0BB9 0BC6 | ஹே 0BB9 0BC7 | ஹை 0BB9 0BC8 | ஹொ 0BB9 0BCA | ஹோ 0BB9 0BCB | ஹௌ 0BB9 0BCC |
க்ஷ் 0B95 0BCD 0BB7 0BCD | க்ஷ 0B95 0BCD 0BB7 | க்ஷா 0B95 0BCD 0BB7 0BBE | க்ஷி 0B95 0BCD 0BB7 0BBF | க்ஷீ 0B95 0BCD 0BB7 0BC0 | க்ஷு 0B95 0BCD 0BB7 0BC1 | க்ஷூ 0B95 0BCD 0BB7 0BC2 | க்ஷெ 0B95 0BCD 0BB7 0BC6 | க்ஷே 0B95 0BCD 0BB7 0BC7 | க்ஷை 0B95 0BCD 0BB7 0BC8 | க்ஷொ 0B95 0BCD 0BB7 0BCA | க்ஷோ 0B95 0BCD 0BB7 0BCB | க்ஷெள 0B95 0BCD 0BB7 0BCC |
Acceso programático
- El script Tamil puede ser manipulado usando la biblioteca Python llamada open-Tamil.
- Hay una aplicación de código abierto de Windows disponible llamada AnyTaFont2UTF8 usando C#.