Base de conocimientos

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Repositorio de información con múltiples aplicaciones

Una base de conocimiento (KB) es un conjunto de oraciones, cada oración dada en un lenguaje de representación de conocimiento, con interfaces para decir nuevas oraciones y hacer preguntas sobre lo que se conoce, donde cualquiera de estas interfaces podría usar inferencia. Es una tecnología utilizada para almacenar datos estructurados complejos utilizados por un sistema informático. El uso inicial del término estaba relacionado con los sistemas expertos, que fueron los primeros sistemas basados en el conocimiento.

Uso original del término

El uso original del término base de conocimientos era para describir uno de los dos subsistemas de un sistema experto. Un sistema basado en el conocimiento consiste en una base de conocimiento que representa hechos sobre el mundo y formas de razonar sobre esos hechos para deducir nuevos hechos o resaltar inconsistencias.

Propiedades

El término "base de conocimientos" fue acuñado para distinguir esta forma de almacenamiento de conocimiento del término más común y ampliamente utilizado base de datos. Durante la década de 1970, prácticamente todos los grandes sistemas de información gerencial almacenaban sus datos en algún tipo de base de datos relacional o jerárquica. En este punto de la historia de la tecnología de la información, la distinción entre una base de datos y una base de conocimiento era clara e inequívoca.

Una base de datos tenía las siguientes propiedades:

  • Datos planos: Los datos generalmente se representaban en un formato tabular con cadenas o números en cada campo.
  • Múltiples usuarios: Una base de datos convencional necesaria para apoyar a más de un usuario o sistema conectado a los mismos datos al mismo tiempo.
  • Transacciones: Un requisito esencial para una base de datos es mantener la integridad y la coherencia entre los datos a los que se acceden los usuarios concurrentes. Estas son las denominadas propiedades ACID: atómica, coherencia, aislamiento y durabilidad.
  • Datos grandes y de larga duración: Una base de datos corporativa necesitaba apoyar no sólo miles sino cientos de miles o más filas de datos. Tal base de datos generalmente necesitaba persistir más allá de los usos específicos de cualquier programa individual; necesitaba almacenar datos durante años y décadas en lugar de para la vida de un programa.

Los primeros sistemas basados en el conocimiento tenían necesidades de datos opuestas a los requisitos de las bases de datos. Un sistema experto requiere datos estructurados. No solo tablas con números y cadenas, sino punteros a otros objetos que a su vez tienen punteros adicionales. La representación ideal para una base de conocimiento es un modelo de objeto (a menudo llamado ontología en la literatura de inteligencia artificial) con clases, subclases e instancias.

Los primeros sistemas expertos también tenían poca necesidad de múltiples usuarios o de la complejidad que conlleva requerir propiedades transaccionales en los datos. Los datos de los primeros sistemas expertos se utilizaron para llegar a una respuesta específica, como un diagnóstico médico, el diseño de una molécula o una respuesta a una emergencia. Una vez que se conoció la solución al problema, no hubo una demanda crítica para almacenar grandes cantidades de datos en una memoria permanente. Una declaración más precisa sería que dadas las tecnologías disponibles, los investigadores se comprometieron y prescindieron de estas capacidades porque se dieron cuenta de que iban más allá de lo que se podía esperar y que podían desarrollar soluciones útiles para problemas no triviales sin ellas. Incluso desde el principio, los investigadores más astutos se dieron cuenta de los beneficios potenciales de poder almacenar, analizar y reutilizar el conocimiento. Por ejemplo, vea la discusión sobre la memoria corporativa en el primer trabajo del programa Knowledge-Based Software Assistant de Cordell Green et al.

Los requisitos de volumen también eran diferentes para una base de conocimientos en comparación con una base de datos convencional. La base de conocimiento necesaria para saber hechos sobre el mundo. Por ejemplo, para representar la declaración de que 'Todos los humanos son mortales', una base de datos normalmente no podría representar este conocimiento general, sino que necesitaría almacenar información sobre miles de tablas que representaban información sobre humanos específicos. Representar que todos los humanos son mortales y poder razonar acerca de cualquier humano dado que son mortales es el trabajo de una base de conocimiento. Representar que George, Mary, Sam, Jenna, Mike,... y cientos de miles de otros clientes son todos humanos con edades, sexo, dirección, etc. específicos es el trabajo de una base de datos.

A medida que los sistemas expertos pasaron de ser prototipos a sistemas implementados en entornos corporativos, los requisitos para su almacenamiento de datos rápidamente comenzaron a superponerse con los requisitos de base de datos estándar para múltiples usuarios distribuidos con soporte para transacciones. Inicialmente, la demanda se podía ver en dos mercados diferentes pero competitivos. De las comunidades de IA y orientación a objetos, surgieron bases de datos orientadas a objetos como Versant. Estos eran sistemas diseñados desde cero para admitir capacidades orientadas a objetos, pero también para admitir servicios de bases de datos estándar. Por otro lado, los grandes proveedores de bases de datos, como Oracle, agregaron capacidades a sus productos que brindaron soporte para los requisitos de la base de conocimientos, como las relaciones y las reglas de clase-subclase.

Internet como base de conocimiento

La siguiente evolución del término "base de conocimientos" fue Internet. Con el auge de Internet, los documentos, el hipertexto y el soporte multimedia ahora eran críticos para cualquier base de datos corporativa. Ya no era suficiente admitir grandes tablas de datos u objetos relativamente pequeños que vivían principalmente en la memoria de la computadora. El soporte para sitios web corporativos requería persistencia y transacciones para documentos. Esto creó una disciplina completamente nueva conocida como Gestión de contenido web.

El otro impulsor de la compatibilidad con documentos fue el auge de los proveedores de gestión del conocimiento, como Lotus Notes. La gestión del conocimiento en realidad es anterior a Internet, pero con Internet hubo una gran sinergia entre las dos áreas. Los productos de gestión del conocimiento adoptaron el término "base de conocimientos" para describir sus repositorios pero el significado tenía una gran diferencia. En el caso de los sistemas anteriores basados en el conocimiento, el conocimiento era principalmente para el uso de un sistema automatizado, para razonar y sacar conclusiones sobre el mundo. Con los productos de gestión del conocimiento, el conocimiento estaba destinado principalmente a los humanos, por ejemplo, para servir como depósito de manuales, procedimientos, políticas, mejores prácticas, códigos y diseños reutilizables, etc. En ambos casos, las distinciones entre los usos y tipos de sistemas fueron mal definido. A medida que la tecnología aumentaba, era raro encontrar un sistema que realmente pudiera clasificarse limpiamente como basado en el conocimiento en el sentido de un sistema experto que realizaba un razonamiento automatizado y basado en el conocimiento en el sentido de gestión del conocimiento que proporcionaba conocimiento en forma de documentos y medios que podrían ser aprovechados por humanos.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save