Código de escritura tamil para el intercambio de información
Código de escritura tamil para el intercambio de información (TSCII) es un esquema de codificación para representar la escritura tamil. Los 128 puntos de código inferiores son ASCII simple, los 128 puntos de código superiores son específicos de TSCII. Después de largos años de uso en Internet únicamente mediante acuerdo privado, se registró con éxito en la IANA en 2007.
TSCII codifica los caracteres en orden visual (escrito), de forma paralela al uso de la máquina de escribir tamil.
Unicode ha utilizado la estrategia de codificación de orden lógico para tamil, siguiendo ISCII, en contraste con el caso de tailandés, donde se adoptó la codificación de orden visual protegida por TIS-620.
El gobierno de Tamil Nadu respalda sus propios estándares TAB/TAM para codificación de 8 bits y aún se pueden encontrar otros esquemas de codificación más antiguos en la WWW.
La colección de texto electrónico gratuita de Project Madurai utiliza la codificación TSCII, pero ya ha comenzado a proporcionar versiones Unicode.
Historia
Los miembros de varios foros basados en listas de correo sintieron la necesidad de una codificación común para tamil a mediados de la década de 1990, ya que en esos foros prevalecían múltiples fuentes codificadas personalizadas. Si bien algunas de las codificaciones comerciales eran más populares que otras, no fueron aceptadas por la comunidad en general debido a intereses comerciales conflictivos. Si bien la mayoría aceptó Unicode como el estándar futuro, la mayoría de los sistemas de escritorio en ese momento todavía no eran capaces de manejar Unicode para el idioma tamil y se requería una codificación provisional de 8 bits.
En 1997 se creó una lista de correo separada para la discusión de dichas codificaciones (webmasters@tamil.net) para iniciar esta discusión, comenzando con un correo electrónico escrito por el Dr. K. Kalyanasundaram al popular autor tamil Sujatha, quien dirigió el comité para estandarización del teclado tamil. Este foro atrajo rápidamente a participantes entusiastas de todo el mundo, incluidos varios destacados académicos tamiles. INFITT mantiene los archivos de estas discusiones.
Después de la publicación de TSCII, la mayoría de los miembros de la lista de correo webmasters@tamil.net pasaron a formar parte de INFITT, que es una iniciativa más amplia para lograr la estandarización y el desarrollo continuo en diversas áreas de la informática tamil.
Diseño de página de códigos
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8x | ௦ | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9x | ௫ | ' | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
Ax | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
Bx | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
Cx | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
Ex | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
- ^ U+0BE6 TAMIL DIGIT ZERO, que se añadió con la versión Unicode 4.1 en marzo de 2005
Herramientas de conversión
Puede convertir documentos codificados UTF-8 a TSCII utilizando las herramientas iconv de GNU de la siguiente manera:
$ iconov -f utf-8 - No. tscii Hola.utf8 ■ Hola.
Mientras que la conversión de TSCII a UTF-8 se realiza intercambiando los indicadores -f y -t.
Aplicación visual
Un proyecto de código abierto está disponible en AnyTaFont2UTF8 es mantenido por Isaiyini Tamil Community
Contenido relacionado
Propiedad (jerga)
OLAC
Iniciativa de fuentes medievales Unicode
Lógica de primer orden
Red semántica