Código de escritura tamil para el intercambio de información

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

Código de escritura tamil para el intercambio de información (TSCII) es un esquema de codificación para representar la escritura tamil. Los 128 puntos de código inferiores son ASCII simple, los 128 puntos de código superiores son específicos de TSCII. Después de largos años de uso en Internet únicamente mediante acuerdo privado, se registró con éxito en la IANA en 2007.

TSCII codifica los caracteres en orden visual (escrito), de forma paralela al uso de la máquina de escribir tamil.

Unicode ha utilizado la estrategia de codificación de orden lógico para tamil, siguiendo ISCII, en contraste con el caso de tailandés, donde se adoptó la codificación de orden visual protegida por TIS-620.

El gobierno de Tamil Nadu respalda sus propios estándares TAB/TAM para codificación de 8 bits y aún se pueden encontrar otros esquemas de codificación más antiguos en la WWW.

La colección de texto electrónico gratuita de Project Madurai utiliza la codificación TSCII, pero ya ha comenzado a proporcionar versiones Unicode.

Historia

Los miembros de varios foros basados en listas de correo sintieron la necesidad de una codificación común para tamil a mediados de la década de 1990, ya que en esos foros prevalecían múltiples fuentes codificadas personalizadas. Si bien algunas de las codificaciones comerciales eran más populares que otras, no fueron aceptadas por la comunidad en general debido a intereses comerciales conflictivos. Si bien la mayoría aceptó Unicode como el estándar futuro, la mayoría de los sistemas de escritorio en ese momento todavía no eran capaces de manejar Unicode para el idioma tamil y se requería una codificación provisional de 8 bits.

En 1997 se creó una lista de correo separada para la discusión de dichas codificaciones (webmasters@tamil.net) para iniciar esta discusión, comenzando con un correo electrónico escrito por el Dr. K. Kalyanasundaram al popular autor tamil Sujatha, quien dirigió el comité para estandarización del teclado tamil. Este foro atrajo rápidamente a participantes entusiastas de todo el mundo, incluidos varios destacados académicos tamiles. INFITT mantiene los archivos de estas discusiones.

Después de la publicación de TSCII, la mayoría de los miembros de la lista de correo webmasters@tamil.net pasaron a formar parte de INFITT, que es una iniciativa más amplia para lograr la estandarización y el desarrollo continuo en diversas áreas de la informática tamil.

Diseño de página de códigos

TSCII
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x ஸ்ரீ க்ஷ ஜ் ஷ் ஸ் ஹ் க்ஷ்
9x ' ஙு ஞு ஙூ ஞூ
Ax NBSPி ©
Bx
Cx டி டீ கு சு டு ணு
Dx து நு பு மு யு ரு லு வு ழு ளு று னு கூ சூ டூ ணூ
Ex தூ நூ பூ மூ யூ ரூ லூ வூ ழூ ளூ றூ னூ க் ங் ச் ஞ்
Fx ட் ண் த் ந் ப் ம் ய் ர் ல் வ் ழ் ள் ற் ன்
  1. ^ U+0BE6 TAMIL DIGIT ZERO, que se añadió con la versión Unicode 4.1 en marzo de 2005

Herramientas de conversión

Puede convertir documentos codificados UTF-8 a TSCII utilizando las herramientas iconv de GNU de la siguiente manera:

$ iconov -f utf-8 - No. tscii Hola.utf8  Hola.

Mientras que la conversión de TSCII a UTF-8 se realiza intercambiando los indicadores -f y -t.

Aplicación visual

Un proyecto de código abierto está disponible en AnyTaFont2UTF8 es mantenido por Isaiyini Tamil Community

Contenido relacionado

Propiedad (jerga)

Owned es una palabra del argot que se originó en la década de 1990 entre los hackers y se refería a "rootear" u obtener control administrativo...

OLAC

OLAC, la Comunidad Abierta de Archivos Lingüísticos, es una iniciativa para crear un medio unificado de búsqueda en bases de datos en línea de recursos...

Iniciativa de fuentes medievales Unicode

En la tipografía digital, la Medieval Unicode Font Initiative es un proyecto que pretende coordinar la codificación y visualización de caracteres...

Lógica de primer orden

Lógica de primer orden: también conocida como lógica de predicados, lógica cuantificacional y cálculo de predicados de primer orden—es una colección...

Red semántica

Una red semántica, o red de marcos, es una base de conocimiento que representa relaciones semánticas entre conceptos en una red. Esto se utiliza a menudo...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save