Arquitectura de subsunción

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

Arquitectura de subsunción es una arquitectura robótica reactiva fuertemente asociada con la robótica basada en el comportamiento que fue muy popular en los años 80 y 90. El término fue introducido por Rodney Brooks y sus colegas en 1986. La subsunción ha tenido una gran influencia en la robótica autónoma y en otras partes de la IA en tiempo real.

Resumen

La arquitectura de subsunción es una arquitectura de control que se propuso en oposición a la IA tradicional o GOFAI. En lugar de guiar el comportamiento mediante representaciones mentales simbólicas del mundo, la arquitectura de subsunción acopla la información sensorial con la selección de acciones de una manera íntima y de abajo hacia arriba.

Hace esto descomponiendo el comportamiento completo en subcomportamientos. Estos subcomportamientos están organizados en una jerarquía de capas. Cada capa implementa un nivel particular de competencia conductual, y los niveles superiores pueden subsumir los niveles inferiores (= integrar/combinar los niveles inferiores en un todo más completo) para crear un comportamiento viable. Por ejemplo, la capa más baja de un robot podría ser 'evitar un objeto'. La segunda capa sería "deambular", que se encuentra debajo de la tercera capa "explora el mundo". Porque un robot debe tener la capacidad de "evitar objetos" para "deambular" efectivamente, la arquitectura de subsunción crea un sistema en el que las capas superiores utilizan las competencias de nivel inferior. Las capas, que reciben información de sensores, funcionan en paralelo y generan salidas. Estas salidas pueden ser comandos para actuadores o señales que suprimen o inhiben otras capas.

Objetivo

La arquitectura de subsunción ataca el problema de la inteligencia desde una perspectiva significativamente diferente a la IA tradicional. Decepcionado con el desempeño del robot Shakey y proyectos similares inspirados en la representación de la mente consciente, Rodney Brooks comenzó a crear robots basados en una noción diferente de inteligencia, que se asemejan a los procesos de la mente inconsciente. En lugar de modelar aspectos de la inteligencia humana a través de la manipulación de símbolos, este enfoque tiene como objetivo la interacción en tiempo real y las respuestas viables a un entorno dinámico de laboratorio u oficina.

El objetivo se basó en cuatro ideas clave:

  • Situaciones – Una idea importante de la IA situada es que un robot debe ser capaz de reaccionar a su entorno dentro de un marco de tiempo como humano. Brooks argumenta que el robot móvil situado no debe representar al mundo a través de un conjunto interno de símbolos y luego actuar en este modelo. En cambio, afirma que "el mundo es su propio mejor modelo", lo que significa que las configuraciones de percepción a acción adecuadas pueden utilizarse para interactuar directamente con el mundo en lugar de modelarlo. Sin embargo, cada módulo/comportador todavía modela el mundo, pero a un nivel muy bajo, cerca de las señales sensorimotoras. Estos modelos simples necesariamente usan supuestos codificados sobre el mundo codificados en los algoritmos mismos, pero evitan el uso de la memoria para predecir el comportamiento del mundo, en lugar de depender de la retroalimentación sensorial directa tanto como sea posible.
  • Embodiment – Brooks argumenta que construir un agente encarnado cumple dos cosas. El primero es que obliga al diseñador a probar y crear un sistema de control físico integrado, no modelos teóricos o robots simulados que podrían no funcionar en el mundo físico. El segundo es que puede resolver el problema de base de símbolos, un problema filosófico que muchos AIs tradicionales encuentran, acoplando directamente los datos sensoriales a acciones significativas. "El mundo causa regresión", y la relación interna de las capas conductuales se basan directamente en el mundo que el robot percibe.
  • Inteligencia – Mirando el progreso evolutivo, Brooks argumenta que desarrollar habilidades perceptivas y de movilidad son una base necesaria para la inteligencia humana. Además, al rechazar las representaciones de arriba hacia abajo como punto de partida viable para la IA, parece que "la inteligencia está determinada por la dinámica de interacción con el mundo".
  • Emergencia – Convencionalmente, los módulos individuales no se consideran inteligentes por sí mismos. Es la interacción de estos módulos, evaluados por observar al agente y su entorno, que generalmente se considera inteligente (o no). "Inteligencia", por lo tanto, está a los ojos del observador."

Las ideas descritas anteriormente siguen siendo parte de un debate en curso sobre la naturaleza de la inteligencia y cómo se debe fomentar el progreso de la robótica y la IA.

Capas y máquinas de estados finitos aumentadas

Cada capa está compuesta por un conjunto de procesadores que son máquinas de estado finito aumentadas (AFSM), el aumento se agrega variables de instancia para contener estructuras de datos programables. Una capa es un módulo y es responsable de un solo objetivo de comportamiento, como "deambular". No existe un control central dentro o entre estos módulos de comportamiento. Todos los AFSM reciben información de manera continua y asíncrona de los sensores relevantes y envían la salida a los actuadores (u otros AFSM). Las señales de entrada que no se leen en el momento en que se entrega una nueva terminan siendo descartadas. Estas señales descartadas son comunes y son útiles para el rendimiento porque permiten que el sistema funcione en tiempo real al tratar con la información más inmediata.

Debido a que no existe un control central, los AFSM se comunican entre sí a través de señales de inhibición y supresión. Las señales de inhibición bloquean las señales para que no lleguen a los actuadores o AFSM, y las señales de supresión bloquean o reemplazan las entradas a las capas o sus AFSM. Este sistema de comunicación AFSM es la forma en que las capas superiores incorporan a las inferiores (consulte la figura 1), así como la forma en que la arquitectura trata con el arbitraje de selección de acción y prioridad en general.

Gráfico 1: Representación abstracta de la arquitectura de subsumo, con las capas de nivel superior subsumiendo los roles de capas de nivel inferior cuando la información sensorial la determina.

El desarrollo de capas sigue una progresión intuitiva. Primero, se crea, prueba y depura la capa más baja. Una vez que se ejecuta el nivel más bajo, uno crea y adjunta la segunda capa con las conexiones adecuadas de supresión e inhibición a la primera capa. Después de probar y depurar el comportamiento combinado, este proceso se puede repetir para (teóricamente) cualquier número de módulos de comportamiento.

Robots

La siguiente es una pequeña lista de robots que utilizan la arquitectura de subsunción.

  • Allen (robot)
  • Herbert, una soda puede recoger robot (ver enlaces externos para un vídeo)
  • Genghis, un robusto andador hexapodal (ver enlaces externos para un vídeo)

Los anteriores se describen en detalle junto con otros robots en Los elefantes no juegan al ajedrez.

Fortalezas y debilidades

Las principales ventajas de la arquitectura son:

  • el énfasis en el desarrollo iterativo y la prueba de sistemas en tiempo real en su dominio objetivo;
  • el énfasis en conectar la percepción limitada y específica de la tarea directamente a las acciones expresadas que la requieren; y
  • el énfasis en el control distributivo y paralelo, integrando así los sistemas de percepción, control y acción de manera similar a los animales.

Las principales desventajas de la arquitectura son:

  • la dificultad de diseñar la selección de acción adaptable mediante un sistema altamente distribuido de inhibición y supresión; y
  • la falta de gran memoria y representación simbólica, que parece restringir la arquitectura de entender el lenguaje;

Cuando se desarrolló la arquitectura de subsunción, la configuración y el enfoque novedosos de la arquitectura de subsunción le permitieron tener éxito en muchos dominios importantes donde la IA tradicional había fallado, a saber, la interacción en tiempo real con un entorno dinámico. Sin embargo, la falta de un gran almacenamiento de memoria, representaciones simbólicas y control central lo coloca en desventaja para aprender acciones complejas, mapear en profundidad y comprender el lenguaje.

Contenido relacionado

Transporte en los Estados Unidos

Fred brooks

Adobe inc.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save