Lenguaje de red universal
Universal Networking Language (UNL) es un lenguaje formal declarativo diseñado específicamente para representar datos semánticos extraídos de textos en lenguaje natural. Se puede utilizar como lenguaje pivote en sistemas de traducción automática interlingüística o como lenguaje de representación del conocimiento en aplicaciones de recuperación de información.
Alcance y objetivos
UNL está diseñado para establecer una base simple para representar los aspectos más centrales de la información y el significado en una forma independiente del lenguaje humano y de la máquina. Como formalismo independiente del idioma, UNL tiene como objetivo codificar, almacenar, difundir y recuperar información independientemente del idioma original en el que se expresó. En este sentido, la UNL busca brindar herramientas para superar la barrera del idioma de manera sistemática.
A primera vista, UNL parece ser una especie de interlingua, en la que los textos de origen se convierten antes de traducirse a los idiomas de destino. Puede, de hecho, usarse para este propósito, y también de manera muy eficiente. Sin embargo, su fuerza real es la representación del conocimiento y su objetivo principal es proporcionar una infraestructura para manejar el conocimiento que ya existe o puede existir en cualquier idioma.
Sin embargo, es importante tener en cuenta que en la actualidad sería una tontería pretender representar el significado "completo" de cualquier palabra, oración o texto para cualquier idioma. Las sutilezas de la intención y la interpretación hacen que el “sentido completo”, como quiera que lo concibamos, sea demasiado variable y subjetivo para cualquier tratamiento sistemático. Por lo tanto, UNL evita las trampas de tratar de representar el "significado completo" de oraciones o textos, enfocándose en cambio en el significado "central" o "consensuado" que se les atribuye con mayor frecuencia. En este sentido, gran parte de la sutileza de la poesía, la metáfora, el lenguaje figurativo, las insinuaciones y otros comportamientos comunicativos complejos e indirectos está más allá del alcance y los objetivos actuales de la UNL. En cambio, UNL se enfoca en el comportamiento comunicativo directo y el significado literal como una base tangible y concreta para la mayoría de las comunicaciones humanas en entornos prácticos del día a día.
Estructura
En el enfoque UNL, la información transmitida por el lenguaje natural se representa oración por oración como un hipergráfico compuesto por un conjunto de enlaces etiquetados binarios dirigidos (denominados relaciones) entre nodos o hipernodos (los Palabras universales, o simplemente UWs), que representan conceptos. Los UW también se pueden anotar con atributos que representan información de contexto.
Como ejemplo, la oración en inglés '¡¿El cielo era azul?!' se puede representar en UNL de la siguiente manera:
En el ejemplo anterior, sky(icl>natural world)
y blue(icl>color)
, que representan conceptos individuales, son UW; "aoj" (= atributo de un objeto) es una relación semántica binaria dirigida que une los dos UW; y "@def", "@interrogative", "@past", "@exclamation" y "@entrada" son atributos que modifican UWs.
Los UW están destinados a representar conceptos universales, pero se expresan en palabras en inglés o en cualquier otro lenguaje natural para que sean legibles por humanos. Consisten en un "encabezado" (la raíz UW) y una "lista de restricciones" (el sufijo UW entre paréntesis), donde las restricciones se utilizan para eliminar la ambigüedad del concepto general transmitido por el encabezado. El conjunto de UWs está organizado en la Ontología UNL, en la que los conceptos de alto nivel se relacionan con los de bajo nivel a través de las relaciones "icl" (= es una especie de), "iof" (= es una instancia de) y "equ" (= es igual a).
Las relaciones pretenden representar enlaces semánticos entre palabras en todos los idiomas existentes. Pueden ser ontológicos (como "icl" y "iof", mencionados anteriormente), lógicos (como "y" y "or" 34;) y temáticos (como "agt" = agente, "ins" = instrumento, "tim" = tiempo, "plc" = lugar, etc.). Actualmente hay 46 relaciones en las UNL Specs. Definen conjuntamente la sintaxis de UNL.
Los atributos representan información que los UW y las relaciones no pueden transmitir. Normalmente, representan información relativa al tiempo ("@past", "@future", etc.), referencia ("@def", "@indef& #34;, etc.), modalidad ("@can", "@must", etc.), enfoque ("@topic", " @focus", etc.), y así sucesivamente.
Dentro del Programa UNL, el proceso de representar oraciones en lenguaje natural en gráficos UNL se llama UNLización, y el proceso de generar oraciones en lenguaje natural a partir de gráficos UNL se llama NLización. La UNLización, que implica el análisis y la comprensión del lenguaje natural, está destinada a llevarse a cabo de forma semiautomática (es decir, por humanos con ayuda informática); y la NLización está pensada para llevarse a cabo de forma completamente automática.
Historia
El Programa UNL comenzó en 1996, como una iniciativa del Instituto de Estudios Avanzados de la Universidad de las Naciones Unidas en Tokio, Japón. En enero de 2001, la Universidad de las Naciones Unidas creó una organización autónoma, la Fundación UNDL, para ser responsable del desarrollo y la gestión del Programa UNL. La fundación, una organización internacional sin fines de lucro, tiene una identidad independiente de la Universidad de las Naciones Unidas, aunque tiene vínculos especiales con la ONU. Heredó de la UNU/IAS el mandato de implementar el Programa UNL para que pueda cumplir su misión.
El programa ya ha superado hitos importantes. La arquitectura general del Sistema UNL ha sido desarrollada con un conjunto de software básico y herramientas necesarias para su funcionamiento. Estos están siendo probados y mejorados. En los últimos años se ha acumulado una gran cantidad de recursos lingüísticos de las diversas lenguas nativas ya en desarrollo, así como de la expresión UNL. Además, ya se cuenta con la infraestructura técnica para ampliar estos recursos, lo que facilitará la participación de muchos más idiomas en el sistema de la UNL a partir de ahora. Cada año se publica un número creciente de artículos científicos y disertaciones académicas sobre la UNL.
El logro más visible hasta el momento es el reconocimiento por parte del Tratado de Cooperación de Patentes (PCT) del carácter innovador y la aplicabilidad industrial de la UNL, que se obtuvo en mayo de 2002 a través de la Organización Mundial de la Propiedad Intelectual (OMPI). La adquisición de las patentes (patentes estadounidenses 6.704.700 y 7.107.206) para la UNL es un logro completamente novedoso dentro de las Naciones Unidas.
Contenido relacionado
Consonante coronaria
Hindi
Gregorio Chaitin