Base de datos distribuida

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Una base de datos en la que se almacenan datos en diferentes lugares físicos.

Una base de datos distribuida es una base de datos en la que los datos se almacenan en diferentes ubicaciones físicas. Puede almacenarse en varias computadoras ubicadas en la misma ubicación física (por ejemplo, un centro de datos); o tal vez dispersos en una red de computadoras interconectadas. A diferencia de los sistemas paralelos, en los que los procesadores están estrechamente acoplados y constituyen un único sistema de base de datos, un sistema de base de datos distribuida consta de sitios débilmente acoplados que no comparten componentes físicos.

Los administradores del sistema pueden distribuir colecciones de datos (por ejemplo, en una base de datos) en varias ubicaciones físicas. Una base de datos distribuida puede residir en servidores de red organizados o en computadoras independientes descentralizadas en Internet, en intranets o extranets corporativas, o en otras redes de la organización. Debido a que las bases de datos distribuidas almacenan datos en varias computadoras, las bases de datos distribuidas pueden mejorar el rendimiento en los sitios de trabajo de los usuarios finales al permitir que las transacciones se procesen en muchas máquinas, en lugar de limitarse a una sola.

Dos procesos aseguran que las bases de datos distribuidas permanezcan actualizadas y vigentes: replicación y duplicación.

La replicación implica el uso de software especializado que busca cambios en la base de datos distributiva. Una vez identificados los cambios, el proceso de replicación hace que todas las bases de datos se vean iguales. El proceso de replicación puede ser complejo y prolongado, dependiendo del tamaño y número de las bases de datos distribuidas. Este proceso también puede requerir mucho tiempo y recursos informáticos.
La duplicación, por otro lado, tiene menos complejidad. Identifica una base de datos como maestro y luego duplica esa base de datos. El proceso de duplicación se realiza normalmente en un tiempo determinado después de horas. Esto es para asegurar que cada ubicación distribuida tenga los mismos datos. En el proceso de duplicación, los usuarios sólo pueden cambiar la base de datos principal. Esto asegura que los datos locales no serán sobrescritos.

Tanto la replicación como la duplicación pueden mantener los datos actualizados en todas las ubicaciones de distribución.

Además de la replicación y fragmentación de bases de datos distribuidas, existen muchas otras tecnologías de diseño de bases de datos distribuidas. Por ejemplo, autonomía local, tecnologías de bases de datos distribuidas síncronas y asíncronas. La implementación de estas tecnologías puede depender y depende de las necesidades del negocio y la sensibilidad/confidencialidad de los datos almacenados en la base de datos y el precio que el negocio está dispuesto a gastar para garantizar la seguridad, consistencia e integridad de los datos.

Al hablar sobre el acceso a bases de datos distribuidas, Microsoft favorece el término consulta distribuida, que define de manera específica del protocolo como "[a]cualquier instrucción SELECT, INSERT, UPDATE o DELETE que hace referencia a tablas y conjuntos de filas de uno o más orígenes de datos OLE DB externos. Oracle proporciona una vista más centrada en el idioma en la que las consultas distribuidas y las transacciones distribuidas forman parte de SQL distribuido.

Contenido relacionado

Más resultados...