Mente Abierta Sentido Común

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Proyecto de inteligencia artificial

Open Mind Common Sense (OMCS) es un proyecto de inteligencia artificial basado en el Media Lab del Instituto Tecnológico de Massachusetts (MIT) cuyo objetivo es construir y utilizar una gran base de conocimientos de sentido común a partir de las contribuciones de muchos miles de personas en la Web. Ha estado activo desde 1999 hasta 2016.

Desde su fundación, ha acumulado más de un millón de datos en inglés de más de 15 000 colaboradores, además de bases de conocimiento en otros idiomas. Gran parte del software de OMCS se basa en tres representaciones interconectadas: el corpus de lenguaje natural con el que las personas interactúan directamente, una red semántica construida a partir de este corpus llamada ConceptNet y una representación matricial de ConceptNet. llamado AnalogySpace que puede inferir nuevos conocimientos mediante la reducción de la dimensionalidad. El conocimiento recopilado por Open Mind Common Sense ha permitido proyectos de investigación en el MIT y en otros lugares.

Historia

El proyecto fue una creación de Marvin Minsky, Push Singh, Catherine Havasi y otros. El trabajo de desarrollo comenzó en septiembre de 1999 y el proyecto se abrió a Internet un año después. Havasi lo describió en su disertación como "un intento de... aprovechar parte del poder informático humano distribuido de Internet, una idea que estaba en sus primeras etapas". El OMCS original fue influenciado por el sitio web Everything2 y su predecesor, y presenta una interfaz minimalista inspirada en Google.

Push Singh se habría convertido en profesor en el Media Lab del MIT y liderado el grupo de Common Sense Computing en 2007, pero se suicidó el 28 de febrero de 2006.

Actualmente, el proyecto está a cargo del Digital Intuition Group en el MIT Media Lab bajo la dirección de Catherine Havasi.

Base de datos y sitio web

Hay muchos tipos diferentes de conocimiento en OMCS. Algunas declaraciones transmiten relaciones entre objetos o eventos, expresadas como frases simples de lenguaje natural: algunos ejemplos incluyen "Se usa un abrigo para mantener el calor", "El sol calienta mucho" y & #34;Lo último que haces cuando preparas la cena es lavar los platos". La base de datos también contiene información sobre el contenido emocional de situaciones, en afirmaciones como "Pasar tiempo con amigos causa felicidad" y "Entrar en un accidente automovilístico te enfada". OMCS contiene información sobre los deseos y objetivos de las personas, tanto grandes como pequeños, como "La gente quiere ser respetado" y "La gente quiere un buen café".

Originalmente, estas declaraciones se podían ingresar en el sitio web como oraciones de texto sin restricciones, que debían analizarse más tarde. La versión actual del sitio web recopila conocimientos únicamente mediante el uso de plantillas para completar espacios en blanco más estructuradas. OMCS también hace uso de los datos recopilados por Game With a Purpose "Verbosity".

En su forma nativa, la base de datos OMCS es simplemente una colección de estas oraciones cortas que transmiten un conocimiento común. Para usar este conocimiento computacionalmente, tiene que ser transformado en una representación más estructurada.

ConceptNet

ConceptNet es una red semántica basada en la información de la base de datos OMCS. ConceptNet se expresa como un gráfico dirigido cuyos nodos son conceptos y cuyos bordes son afirmaciones de sentido común sobre estos conceptos. Los conceptos representan conjuntos de frases de lenguaje natural estrechamente relacionadas, que pueden ser frases nominales, frases verbales, frases adjetivas o cláusulas.

ConceptNet se crea a partir de las aserciones de lenguaje natural en OMCS comparándolas con patrones utilizando un analizador superficial. Las afirmaciones se expresan como relaciones entre dos conceptos, seleccionados de un conjunto limitado de posibles relaciones. Las diversas relaciones representan patrones de oraciones comunes que se encuentran en el corpus de OMCS y, en particular, cada "completar los espacios en blanco" plantilla utilizada en el sitio web de recopilación de conocimientos está asociada con una relación particular.

Las estructuras de datos que componen ConceptNet se reorganizaron significativamente en 2007 y se publicaron como ConceptNet 3. El grupo Agentes de software actualmente distribuye una base de datos y una API para la nueva versión 4.0.

En 2010, la cofundadora y directora de OMCS, Catherine Havasi, junto con Robyn Speer, Dennis Clark y Jason Alonso, crearon Luminoso, una empresa de software de análisis de texto que se basa en ConceptNet. Utiliza ConceptNet como su principal recurso léxico para ayudar a las empresas a entender y obtener información de grandes cantidades de datos cualitativos, incluidas encuestas, reseñas de productos y redes sociales.

Herramientas de aprendizaje automático

La información de ConceptNet se puede utilizar como base para algoritmos de aprendizaje automático. Una representación, llamada AnalogySpace, utiliza la descomposición de valores singulares para generalizar y representar patrones en el conocimiento en ConceptNet, de manera que pueda usarse en aplicaciones de IA. Sus creadores distribuyen un kit de herramientas de aprendizaje automático de Python llamado Divisi para realizar aprendizaje automático basado en corpus de texto, bases de conocimiento estructuradas como ConceptNet y combinaciones de los dos.

Comparación con otros proyectos

Otros proyectos similares incluyen Never-Ending Language Learning, Mindpixel (descontinuado), Cyc, Learner, SenticNet, Freebase, YAGO, DBpedia y Open Mind 1001 Questions, que han explorado enfoques alternativos para recopilar conocimientos y proporcionar incentivos para la participación.

El proyecto Open Mind Common Sense se diferencia de Cyc porque se centró en representar el conocimiento de sentido común que recopiló como oraciones en inglés, en lugar de usar una estructura lógica formal. ConceptNet es descrito por uno de sus creadores, Hugo Liu, como estructurado más como WordNet que como Cyc, debido a su "énfasis en la conexión conceptual informal sobre el rigor lingüístico formal".

También está la iniciativa brasileña, denominada Mente Abierta Sentido Común en Brasil (OMCS-Br), liderada por el Laboratorio de Interacción Avanzada de la Universidad Federal de São Carlos (LIA-UFSCar). Este proyecto comenzó en 2005, en colaboración con el Grupo de Agentes de Software del MIT Media Lab, el objetivo principal es recopilar el sentido común expresado en portugués brasileño y utilizarlo para desarrollar aplicaciones de software culturalmente sensibles basadas en la extracción de perfiles culturales. conocimiento de ConceptNet. Esto tiene como objetivo ayudar a los desarrolladores y usuarios con un software de contenido culturalmente contextualizado, haciendo que las aplicaciones finales sean más flexibles, adaptables, accesibles y usables. Las principales aplicaciones' Los focos son la educación y la salud.

Contenido relacionado

Directorio raíz

En un sistema de archivos de computadora, y se usa principalmente en los sistemas operativos Unix y similares a Unix, el directorio raíz es el primer...

Vista plana

Vista simple o Vista simple puede referirse...

Matías Ettrich

Matthias Ettrich es un informático alemán y fundador de los proyectos KDE y...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save