Kismet (robot)

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Kismet reside ahora en el Museo del MIT.

Kismet es una cabeza de robot fabricada en la década de 1990 en el Instituto Tecnológico de Massachusetts (MIT) por la Dra. Cynthia Breazeal como experimento de computación afectiva; una máquina que puede reconocer y simular emociones. El nombre Kismet proviene de una palabra turca que significa "destino"; o a veces "suerte".

Diseño y construcción de hardware

Para que Kismet interactúe adecuadamente con los seres humanos, contiene dispositivos de entrada que le otorgan capacidades auditivas, visuales y de propiocepción. Kismet simula emociones a través de diversas expresiones faciales, vocalizaciones y movimientos. Las expresiones faciales se crean mediante movimientos de las orejas, las cejas, los párpados, los labios, la mandíbula y la cabeza. El costo de los materiales físicos se estimó en 25.000 dólares estadounidenses.

Además del equipo mencionado anteriormente, hay cuatro Motorola 68332, nueve PC de 400 MHz y otro PC de 500 MHz.

Sistema de software

El sistema de software de inteligencia social de Kismet, o sistema nervioso sintético (SNS), fue diseñado teniendo en mente modelos humanos de comportamiento inteligente. Contiene seis subsistemas de la siguiente manera.

Sistema de extracción de características de bajo nivel

Este sistema procesa información visual y auditiva sin procesar procedente de cámaras y micrófonos. El sistema de visión de Kismet puede realizar detección de ojos, detección de movimiento y, aunque controvertida, detección del color de la piel. Cada vez que Kismet mueve su cabeza, desactiva momentáneamente su sistema de detección de movimiento para evitar detectar su propio movimiento. También utiliza sus cámaras estéreo para estimar la distancia de un objeto en su campo visual, por ejemplo para detectar amenazas: objetos grandes, cercanos y con mucho movimiento.

El sistema de audio de

Kismet está principalmente sintonizado para identificar el afecto en el habla dirigida a los bebés. En particular, puede detectar cinco tipos diferentes de discurso afectivo: aprobación, prohibición, atención, comodidad y neutral. El clasificador de intención afectiva se creó de la siguiente manera. Se extrajeron características de bajo nivel, como la media del tono y la variación de energía (volumen), de muestras de voz grabada. Luego, las clases de intención afectiva se modelaron como un modelo de mezcla gaussiana y se entrenaron con estas muestras utilizando el algoritmo de maximización de expectativas. La clasificación se realiza en múltiples etapas, primero clasificando una expresión en uno de dos grupos generales (por ejemplo, calmante/neutral versus prohibición/atención/aprobación) y luego realizando una clasificación más detallada. Esta arquitectura mejoró significativamente el rendimiento para clases difíciles de distinguir, como aprobación ("eres un robot inteligente") frente a atención (& #34;Hola Kismet, por aquí").

Sistema de motivación

Dra. Breazeal imagina sus relaciones con el robot como "algo así como una interacción entre un bebé y un cuidador, donde yo soy esencialmente el cuidador y el robot es como un bebé". La descripción general sitúa la relación entre humanos y robots dentro de un marco de aprendizaje, con el Dr. Breazeal proporcionando el andamiaje para el desarrollo de Kismet. Ofrece una demostración de las capacidades de Kismet, narradas como expresiones faciales emotivas que comunican el "estado motivacional" del robot, Dr. Brazeal: "Esto es ira (risas) ira extrema, asco, excitación, miedo, esto es felicidad, éste es interés, éste es tristeza, sorpresa, éste es cansancio y éste es sueño."

En un momento dado, Kismet sólo puede estar en un estado emocional a la vez. Sin embargo, Breazeal afirma que Kismet no es consciente, por lo que no tiene sentimientos.

Sistema motor

Kismet habla un protolenguaje con una variedad de fonemas, similar al balbuceo de un bebé. Utiliza el sintetizador de voz DECtalk y cambia el tono, el tiempo, la articulación, etc. para expresar diversas emociones. La entonación se utiliza para variar entre expresiones tipo pregunta y declaración. La sincronización de labios era importante para el realismo y los desarrolladores utilizaron una estrategia de animación: "la simplicidad es el secreto para una animación de labios exitosa". Por lo tanto, no intentaron imitar los movimientos de los labios a la perfección, sino "crear una mano corta visual que pase sin ser cuestionada por el espectador".

Contenido relacionado

Decodificador binario

En electrónica digital, un decodificador binario es un circuito lógico combinacional que convierte la información binaria de las n entradas codificadas en...

Túnel de Kilsby

El túnel de Kilsby es un túnel ferroviario en la línea principal de la costa oeste de Inglaterra, cerca del pueblo de Kilsby en Northamptonshire, a unas 5...

F Sharp (lenguaje de programación)

F# es un lenguaje de programación funcional primero, de propósito general, fuertemente tipado y multiparadigma que abarca funcionalidad, imperativo y...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save