Consistencia causal

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

La consistencia causal es uno de los principales modelos de consistencia de memoria. En la programación concurrente, donde procesos concurrentes acceden a una memoria compartida, un modelo de consistencia restringe qué accesos son legales. Esto resulta útil para definir estructuras de datos correctas en la memoria compartida distribuida o en transacciones distribuidas.

La consistencia causal está “disponible bajo partición”, lo que significa que un proceso puede leer y escribir en la memoria (la memoria está disponible) incluso cuando no hay una conexión de red en funcionamiento (la red está particionada) entre procesos; es un modelo asincrónico. A diferencia de los modelos de consistencia fuerte, como la consistencia secuencial o la linealización, que no pueden ser seguros y funcionar bajo partición, y responden con lentitud porque requieren sincronización.

La consistencia causal se propuso en la década de 1990 como un modelo de consistencia más débil para los modelos de memoria compartida. La consistencia causal está estrechamente relacionada con el concepto de transmisión causal en los protocolos de comunicación. En estos modelos, una ejecución distribuida se representa como un orden parcial, basado en el concepto de causalidad potencial de "sucedió antes" de Lamport.

La consistencia causal es un modelo de consistencia útil porque coincide con las intuiciones de los programadores sobre el tiempo, está más disponible que los modelos de consistencia fuerte y, sin embargo, proporciona garantías más útiles que la consistencia eventual. Por ejemplo, en bases de datos distribuidas, la consistencia causal respalda el ordenamiento de las operaciones, en contraste con la consistencia eventual. Además, la consistencia causal ayuda con el desarrollo de tipos de datos abstractos, como colas o contadores.

Dado que el tiempo y el orden son tan fundamentales para nuestra intuición, es difícil razonar sobre un sistema que no impone la coherencia causal. Sin embargo, muchas bases de datos distribuidas carecen de esta garantía, incluso las que ofrecen serialización. Spanner garantiza la coherencia causal, pero también impone una coherencia fuerte, evitando así la disponibilidad bajo partición. Las bases de datos más disponibles que garantizan la coherencia causal incluyen MongoDB y AntidoteDB.

Definición

La coherencia causal captura las posibles relaciones causales entre operaciones y garantiza que todos los procesos observen operaciones causalmente relacionadas en un orden común. En otras palabras, todos los procesos del sistema están de acuerdo en el orden de las operaciones causalmente relacionadas. Pueden estar en desacuerdo en el orden de las operaciones que no están causalmente relacionadas.

Definamos la siguiente relación. Si algún proceso realiza una operación de escritura A, y algún proceso (el mismo u otro) que observó A realiza luego una operación de escritura B, entonces es posible que A sea la causa de B; decimos que A “causa potencialmente” o “precede causalmente” a B. La consistencia causal garantiza que si A precede causalmente a B, entonces cada proceso en el sistema observa A antes de observar B. Por el contrario, se dice que dos operaciones de escritura C y D son concurrentes, o causalmente independientes, si ninguna precede causalmente a la otra. En este caso, un proceso puede observar C antes que D, o D antes que C. La relación de precedencia causal en la memoria compartida está relacionada con la relación de "ocurrió antes" en la comunicación basada en mensajes.

Por lo tanto, un sistema proporciona coherencia causal si se cumple la siguiente condición: las operaciones de escritura que están relacionadas por causalidad potencial son vistas por cada proceso del sistema en su orden de precedencia causal. Diferentes procesos pueden observar escrituras concurrentes en diferentes órdenes.

El modelo de consistencia causal es más débil que el de consistencia secuencial, que garantiza que todos los procesos observen todas las operaciones de escritura en un orden común, ya sea que estén relacionadas causalmente o no. Sin embargo, la consistencia causal es más fuerte que la consistencia PRAM, que requiere que solo las operaciones de escritura que realiza un solo proceso sean observadas en un orden común por todos los demás procesos. De ello se deduce que cuando un sistema es secuencialmente consistente, también es causalmente consistente. Además, la consistencia causal implica consistencia PRAM, pero no viceversa.

Ejemplo

A continuación se muestra un ejemplo de coherencia causal.

En la siguiente secuencia de eventos se respetan las relaciones causales:

P1:	W(x)1		W(x)3
P2:	R(x)1	W(x)2
P3:	R(x)1			R(x)3	R(x)2
P4:	R(x)1			R(x)2	R(x)3

El proceso P2 observa y lee la escritura anterior W(x)1 realizada por el proceso P1. Por lo tanto, las dos escrituras W(x)1 y W(x)2 están relacionadas causalmente. En condiciones de coherencia causal, cada proceso observa primero W(x)1, antes de observar W(x)2. Observe que las dos operaciones de escritura W(x)2 y W(x)3, sin operaciones de lectura intermedias, son concurrentes, y los procesos P3 y P4 las observan (leen) en órdenes diferentes.

Garantías de sesión

El modelo de consistencia causal se puede refinar en cuatro garantías de sesión, que se pueden resumir de la siguiente manera:

Lea sus escritos: Si un proceso realiza una escritura, el mismo proceso observa más adelante el resultado de su escritura.

Monotonic Lees: el conjunto de escritos observados (leer) por un proceso está garantizado para ser monotonicamente no-disminución.

Escribir Sigue Lecturas: si algún proceso realiza una lectura seguida de una escritura, y otro proceso observa el resultado de la escritura, entonces también puede observar la lectura (a menos que haya sido sobrescrito).

Monotonic Writes: Si algún proceso realiza un escrito, seguido algún tiempo más tarde por otro escrito, otros procesos los observarán en el mismo orden.

Daudjee y Salem presentan garantías de sesión transaccional para serialización y aislamiento de instantáneas.

Aplicación

El sistema se abstrae como un conjunto de procesos que se comunican. Cuando un proceso escribe en la memoria compartida, la implementación envía este evento a los demás procesos (a través de la memoria compartida o como un mensaje). Debido a la concurrencia y a las fallas, un proceso puede recibir eventos en cualquier orden. La implementación entrega un evento, es decir, lo hace visible para el proceso, solo si todos los eventos que lo preceden causalmente se han entregado. Esto requiere que la implementación mantenga metadatos que representen las relaciones causales entre los accesos a la memoria.

En resumen, la implementación incluye los siguientes pasos: (1) Mantener metadatos de contexto causal en cada proceso para resumir qué actualizaciones preceden causalmente al estado actual. (2) Cuando un proceso actualiza la memoria, etiquetar el evento de actualización con el contexto causal de ese proceso, para resumir qué actualizaciones preceden causalmente a esta actualización. (3) Un proceso que ha recibido algún evento de actualización puede entregarlo sólo si la etiqueta del evento precede causalmente al contexto causal del proceso receptor. (Como efecto secundario de la entrega, agregar el nuevo evento al contexto causal del proceso receptor). De lo contrario, la actualización se recibió demasiado pronto y debe permanecer almacenada en el búfer hasta que el evento coincida con el contexto. Mientras tanto, la implementación espera pasivamente para recibir los eventos faltantes o los recupera activamente de su fuente.

Este enfoque permite la disponibilidad bajo partición.

Existen dos representaciones comunes para los metadatos del contexto causal. Una es mantener un gráfico de dependencia explícita de la relación de dependencia causal. Debido a que un gráfico de este tipo puede crecer arbitrariamente, un evento a menudo se etiqueta solo con sus predecesores inmediatos; determinar sus predecesores transitivos requiere un recorrido de gráfico distribuido. La otra es mantener un reloj vectorial, con una entrada por proceso (o grupo de procesos), que cuente la cantidad de eventos generados por el proceso o grupo. Esta representación tiene un tamaño fijo y el orden de los eventos se puede inferir mediante una simple comparación de los vectores.

Para determinar con precisión qué eventos son dependientes y cuáles son concurrentes en un sistema totalmente peer-to-peer, el tamaño de los metadatos es al menos proporcional al número de escritores activos. Sin embargo, una determinación precisa de la concurrencia es generalmente excesiva. La consistencia causal requiere solamente que los eventos causalmente dependientes se entreguen en orden; no importa si dos eventos concurrentes terminan siendo ordenados. Por lo tanto, el tamaño se puede reducir arbitrariamente utilizando técnicas de aproximación segura. En el límite, un único escalar (un reloj Lamport) es suficiente, a costa de eliminar cualquier concurrencia. El tamaño de los metadatos también se puede reducir restringiendo la topología de comunicación; por ejemplo, en una topología en estrella, árbol o lineal, un único escalar es suficiente.

La búsqueda de implementaciones eficientes de la consistencia causal es un área de investigación muy activa.

Referencias

^ a b Ahamad, Mustaque; Neiger, Gil; Burns, James E.; Kohli, Prince; Hutto, Phillip W. (marzo de 1995), "Recuerdo básico: definiciones, implementación y programación", Computación distribuida, 9 (1): 37–49, doi:10.1007/bf01784241, hdl:1853/6781S2CID 6435056
^ Birman, Kenneth P.; Joseph, Thomas A. (enero de 1987), "Comunicación confiable en presencia de fracasos", Transacciones ACM en sistemas informáticos, 5 (1): 47–76, doi:10.1145/7351.7478, hdl:1813/6534S2CID 11224827
^ a b c Lamport, Leslie (1978), "Tiempo, relojes y orden de eventos en un sistema distribuido", Comunicaciones de la ACM, 21 (7): 558-565, doi:10.1145/359545.359563S2CID 215822405
^ Elbushra, Mawahib Musa; Lindström, Jan (2015), "Causal consistent databases", Open Journal of Databases, 2 1): 17 a 35
^ Perrin, Matthieu; Mostéfaoui, Achour; Jard, Claude (2016), "Congruencia corporal: más allá de la memoria", en Asenjo, Rafael; Harris, Tim (eds.), Proceedings of the 21st ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, PPoPP 2016, Barcelona, Spain, March 12-16, 2016, pp. 26:1–26:12, arXiv:1603.04199, doi:10.1145/2851141.2851170, S2CID 3010991
^ Daudjee, Khuzaima; Salem, Kenneth (2004), "Lazy database replication with ordering guarantees", en Özsoyoglu, Z. Meral; Zdonik, Stanley B. (eds.), Proceedings of the 20th International Conference on Data Engineering, ICDE 2004, 30 March – 2 April 2004, Boston, MA, USA, IEEE Computer Society, pp. 424-435, CiteSeerX 10.1.1.564.1562, doi:10.1109/ICDE.2004.1320016, S2CID 1850131
^ Gogia, R., Chhabra, P., " Kumari, R. (2014). Modelos de consistencia en sistemas de memoria compartidos distribuidos. International Journal of Computer Science and Mobile Computing,196-201
^ Lamport, L. (1979). Cómo hacer un ordenador multiprocesador que ejecuta correctamente programas multiproceso. Operaciones de IEEE en computadoras, 100(9), 690-691.
^ Lipton, R. J., " Sandberg, J. S. (1988). PRAM: Una memoria compartida escalable. Princeton University, Department of Computer Science.Chicago
^ Mosberger, D. (1993). Modelos de consistencia de memoria. ACM SIGOPS Operating Systems Review, 27(1), 18-26.
^ J. Brzezinski, C. Sobaniec y D. Wawrzyniak, "De la causalidad de la sesión a la consistencia causal", 12a Conferencia Euromicro sobre Parallel, Distributed and Network-Based Processing, 2004. Proceedings., Coruna, Spain, 2004, pp. 152-158, doi: 10.1109/EMPDP.2004.1271440.
^ K. Daudjee y K. Salem. Replicación lenta de la base de datos con aislamiento de instantáneas. VLDB 2006.
^ Carlos Baquero y Nuno Preguiça. Por qué los cuellos lógicos son fáciles. Comm. ACM 59(4), pp. 43–47, abril 2016.
^ Charron-Bost, Bernadette (julio 1991), "Concertando el tamaño de los relojes lógicos en sistemas distribuidos", Cartas de procesamiento de información, 39 (1): 11–16, doi:10.1016/0020-0190(91)90055-m
^ Torres-Rojas, Francisco J.; Ahamad, Mustaque (septiembre de 1999), "Plausibles relojes: relojes lógicos de tamaño constante para sistemas distribuidos", Computación distribuida, 12 (4): 179–195, doi:10.1007/s004460050065, S2CID 2936350

Más resultados...