Problema de los tres prisioneros

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

El problema de los tres prisioneros apareció en la columna de Martin Gardner titulada "Juegos matemáticos" en la revista Scientific American en 1959. Es matemáticamente equivalente al problema de Monty Hall, en el que el coche y la cabra se sustituyen respectivamente por la libertad y la ejecución.

Problema

Tres prisioneros, A, B y C, están en celdas separadas y condenados a muerte. El director ha elegido al azar a uno de ellos para que sea indultado. El director sabe quién será indultado, pero no se le permite decirlo. El prisionero A le ruega al director que le permita saber la identidad de uno de los dos que van a ser ejecutados. "Si B va a ser indultado, deme el nombre de C. Si C va a ser indultado, deme el nombre de B. Y si yo voy a ser indultado, tire una moneda en secreto para decidir si nombrar a B o a C".

El director le dice a A que B debe ser ejecutado. El prisionero A está contento porque cree que su probabilidad de sobrevivir ha aumentado de 1/3 a 1/2, como ahora está entre él y C. El prisionero A le cuenta en secreto la noticia a C, quien razona que la probabilidad de A de ser indultado no ha cambiado en 1/3, pero está contento porque su propia oportunidad ha aumentado a 2/3. ¿Cuál prisionero tiene razón?

Solución

La respuesta es que el prisionero A no obtuvo ninguna información sobre su propio destino, pues ya sabía que el director le daría el nombre de otra persona. El prisionero A, antes de escuchar al director, estima que sus posibilidades de ser indultado son 1/3, las mismas que las de B y C. Como el director dice que B será ejecutado, es porque C será indultado (1/3 probabilidad), o A será indultado (1/3 probabilidad) y la moneda para decidir si nombrar B o C que el alcaide lanzó salió B (1/2 probabilidad; para una probabilidad general de 1/2 × 1/3 = 1/6 probabilidad de que B fuera nombrado porque A será perdonado). Por lo tanto, después de escuchar que B será ejecutado, la estimación de la probabilidad de que A sea indultado es la mitad de la de C. Esto significa que sus probabilidades de ser indultado, ahora que sabe que B no lo es, son de nuevo 1/3, pero C tiene una probabilidad de 2/3 de ser indultado.

Cuadro

La explicación anterior se puede resumir en la siguiente tabla. Como A le pide al director que lo ejecute (o que no lo indulte), éste solo puede responder que B o C lo ejecuten.

Ser perdonado"No B""No C"Sum
A1/61/61/3
B01/31/3
C1/301/3

Como el director ha respondido que B no será indultado, la solución viene de la segunda columna "no B". Parece que las probabilidades de que A y C sean indultados son de 1:2.

Formulación matemática

Call , y los eventos que el prisionero correspondiente será perdonado, y el evento que el director le dice a A que el prisionero B debe ser ejecutado, entonces, usando el teorema de Bayes, la probabilidad posterior de que A sea perdonado, es:

La probabilidad de que C sea indultado, por otra parte, es:

La diferencia crucial que hace que A y C sean desiguales es que pero . Si se perdona A, el alcaide puede decir A que B o C debe ser ejecutado, y por lo tanto ; mientras que si C será perdonado, el alcaide sólo puede decir A que B es ejecutado, así .

Una explicación intuitiva

El prisionero A solo tiene una probabilidad de 1/3 de ser indultado. Saber si B o C serán ejecutados no cambia sus posibilidades. Después de escuchar que B será ejecutado, el prisionero A se da cuenta de que si no obtendrá el indulto él mismo, solo lo obtendrá C. Eso significa que hay una probabilidad de 2/3 de que C obtenga el indulto. Esto es comparable al problema de Monty Hall.

Enumeración de posibles casos

Pueden presentarse los siguientes escenarios:

  1. A es perdonado y el alcaide menciona B para ser ejecutado: 1/3 × 1/2 = 1/6 de los casos
  2. A es perdonado y el alcaide menciona C para ser ejecutado: 1/3 × 1/2 = 1/6 de los casos
  3. B es perdonado y el alcaide menciona C para ser ejecutado: 1/3 de los casos
  4. C es perdonado y el alcaide menciona B para ser ejecutado: 1/3 de los casos

Con la estipulación de que el director elegirá al azar, en el 1/3 del tiempo en que A debe ser indultado, hay una 1/2 probabilidad de que diga B y una 1/2 probabilidad de que diga C. Esto significa que, en general, 1/6 del tiempo (1/3 [que A es indultado] × 1/2 [que el alcaide dice B]), el alcaide dirá B porque A será indultado, y 1/6 de las veces (1/3 [que A está indultado] × 1/2 [que el director dice C]) dirá C porque A está siendo indultado. Esto suma un total de 1/3 del tiempo (1/6 + 1/6) A está siendo indultado, lo cual es correcto.

Ahora está claro que si el alcaide responde B a A (1/2 de todos los casos), entonces 1/3 de las veces C es indultado y A aún será ejecutado (caso 4), y solo 1/6 de las veces El momento A es perdonado (caso 1). Por lo tanto, las probabilidades de C son (1/3)/(1/2) = 2/3 y las de A son (1/6)/(1/2) = 1/3.

La clave de este problema es que el director no puede revelar el nombre de un preso que será indultado. Si eliminamos este requisito, podemos demostrar el problema original de otra manera. El único cambio en este ejemplo es que el preso A pide al director que revele el destino de uno de los otros presos (sin especificar uno que será ejecutado). En este caso, el director lanza una moneda y elige a uno de B y C para revelar el destino. Los casos son los siguientes:

  1. Un indulto, el director dice: B ejecutado (1/6)
  2. Un indulto, el alcaide dice: C ejecutado (1/6)
  3. B perdonado, alcaide dice: B perdonado (1/6)
  4. B perdonado, el director dice: C ejecutado (1/6)
  5. C perdonado, el alcaide dice: B ejecutado1/6)
  6. C perdonado, el alcaide dice: C perdonado (1/6)

Cada escenario tiene una probabilidad de 1/6. El problema original de los tres prisioneros se puede ver desde esta perspectiva: el director en ese problema todavía tiene estos seis casos, cada uno con una probabilidad de 1/6 de ocurrir. Sin embargo, el director en el caso original no puede revelar el destino de un prisionero indultado. Por lo tanto, en el caso 3, por ejemplo, dado que decir "B es indultado" no es una opción, el director dice "C es ejecutado" en su lugar (lo que lo hace igual que el caso 4). Eso deja a los casos 4 y 5 cada uno con una probabilidad de ocurrencia de 1/3 y nos deja con la misma probabilidad que antes.

¿Por qué la paradoja?

La tendencia de las personas a proporcionar la respuesta 1/2 es probable debido a una tendencia a ignorar el contexto que puede parecer inimpacto. Por ejemplo, cómo la pregunta se plantea al director puede afectar la respuesta. Esto se puede mostrar considerando un caso modificado, donde y todo lo demás sobre el problema sigue siendo el mismo. Usando Bayes Teorema una vez más:

Sin embargo, si A simplemente pregunta si B será ejecutado, y el director responde "sí", la probabilidad de que A sea indultado se convierte en:

Un supuesto similar es que A planea de antemano pedirle esta información al alcaide. Un caso similar al anterior surge si A no planea preguntarle nada al alcaide y el alcaide simplemente le informa que ejecutará a B.

Otro supuesto probablemente pasado por alto es que el director tiene una elección probabilística. Definimos como la probabilidad condicional de que el alcaide nombre B dado que C será ejecutado. La probabilidad condicional se puede expresar entonces como:

Si asumimos que , es decir, que no tenemos en cuenta que el alcaide está haciendo una elección probabilista, entonces . Sin embargo, la realidad del problema es que el alcaide está volteando una moneda (), así que .

Judea Pearl (1988) utilizó una variante de este ejemplo para demostrar que las actualizaciones de creencias deben depender no sólo de los hechos observados sino también del experimento (es decir, la consulta) que condujo a esos hechos.

  • Problema de Monty Hall
  • Paradoja para niños o niñas
  • Principio de elección restringida, una aplicación en el puente de juego de cartas
  • El dilema del preso, un problema de teoría del juego
  • Problema de belleza durmiente
  • Dos sobres problema

Referencias

  1. ^ Gardner, Martin (octubre de 1959). "Juegos matemáticos: Problemas que implican cuestiones de probabilidad y ambigüedad". Scientific American. 201 (4): 174–182. doi:10.1038/cientificamerican1059-174.
  2. ^ Gardner, Martin (1959). "Juegos matemáticos: Cómo tres matemáticos modernos desaprobaron una famosa conjetura de Leonhard Euler". Scientific American. 201 (5): 188. doi:10.1038/scientificamerican1159-181.
  3. ^ Bailey, Herb (2000). "Monty Hall utiliza una estrategia mixta". Revista Matemática. 73 (2): 135-141. JSTOR 2691085.
  4. ^ a b c Shimojo, Shinsuke; Ichikawa, Shin'Ichi (agosto de 1990). "Razones intuitivas sobre probabilidad: Análisis teórico y experimental del "problema de tres prisioneros"". Cognición. 36 (2): 205. doi:10.1016/0010-0277(89)90012-7. PMID 2752704. S2CID 45658299.
  5. ^ a b Wechsler, Sergio; Esteves, L. G.; Simonis, A.; Peixoto, C. (Febrero 2005). "Indiferencia, neutralidad e información: generalización de la paradoja de los tres presos". Sintesis. 143 (3): 255–272. doi:10.1007/s11229-005-7016-1. JSTOR 20118537. S2CID 16773272. Retrieved 15 de diciembre 2021.
  6. ^ Billingsley, Patrick (1995). Probability and measure. Wiley Series en Probability and Mathematical Statistics (Tercera edición de 1979 original ed.). Nueva York: John Wiley ' Sons, Inc. Ejercicio 33.3, págs. 441 y 576. ISBN 0-471-00710-2. MR 1324786.
  7. ^ Pearl, J. (1988). Razones probabilistas en sistemas inteligentes: redes de referencia plausible (Primera edición). San Mateo, CA: Morgan Kaufmann.

Más lectura

  • Frederick Mosteller, Cincuenta problemas de desafío en probabilidad, p. 28, en Google Books.
  • Richard Isaac, Placeres de probabilidad, p. 24, en Google Books.
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save