Juego de suma cero

Compartir Imprimir Citar
Situación en que las ganancias totales coinciden con las pérdidas totales

Juego de suma cero es una representación matemática en teoría de juegos y teoría económica de una situación que involucra a dos lados, donde el resultado es una ventaja para un lado y una pérdida equivalente para el otro. En otras palabras, la ganancia del jugador uno es equivalente a la pérdida del jugador dos, por lo que la mejora neta en beneficio del juego es cero.

Si se suman las ganancias totales de los participantes y se restan las pérdidas totales, la suma será cero. Por lo tanto, cortar un pastel, donde tomar un trozo más significativo reduce la cantidad de pastel disponible para otros tanto como aumenta la cantidad disponible para ese tomador, es un juego de suma cero si todos los participantes valoran cada unidad de pastel por igual. Otros ejemplos de juegos de suma cero en la vida diaria incluyen juegos como el póquer, el ajedrez y el bridge, donde una persona gana y otra pierde, lo que da como resultado un beneficio neto cero para cada jugador. En los mercados y los instrumentos financieros, los contratos de futuros y las opciones también son juegos de suma cero.

Por el contrario, non-zero-sum describe una situación en la que las partes que interactúan' las ganancias y pérdidas agregadas pueden ser menores o mayores que cero. Un juego de suma cero también se denomina juego estrictamente competitivo, mientras que los juegos de suma distinta de cero pueden ser competitivos o no competitivos. Los juegos de suma cero se resuelven con mayor frecuencia con el teorema minimax, que está estrechamente relacionado con la dualidad de programación lineal, o con el equilibrio de Nash. El dilema del prisionero es un juego clásico de suma distinta de cero.

Definición

Elección 1 Elección 2
Elección 1 −A, A B, −B
Elección 2 C, −C −D, D
Genérico cero-sum juego
Opción 1 Opción 2
Opción 1 2, 2 - 2 −2, 2
Opción 2 −2, 2 2, 2 - 2
Otro ejemplo del juego clásico cero-sum

La propiedad de suma cero (si uno gana, otro pierde) significa que cualquier resultado de una situación de suma cero es óptimo de Pareto. En general, cualquier juego en el que todas las estrategias sean óptimas de Pareto se denomina juego de conflicto.

Los juegos de suma cero son un ejemplo específico de juegos de suma constante en los que la suma de cada resultado siempre es cero. Estos juegos son distributivos, no integradores; el pastel no puede agrandarse con una buena negociación.

En una situación en la que la ganancia (o pérdida) de un tomador de decisiones no necesariamente resulta en que los otros tomadores de decisiones ganen (o pierdan) pérdida (o ganancia), se denominan de suma distinta de cero. Por lo tanto, un país con un exceso de bananas comerciando con otro país por su exceso de manzanas, donde ambos se benefician de la transacción, se encuentra en una situación de suma distinta de cero. Otros juegos de suma distinta de cero son juegos en los que la suma de las ganancias y pérdidas de los jugadores a veces es mayor o menor que con lo que comenzaron.

La idea del pago óptimo de Pareto en un juego de suma cero da lugar a un estándar generalizado de racionalidad egoísta relativa, el estándar de castigar al oponente, en el que ambos jugadores siempre buscan minimizar el pago del oponente a un precio favorable. cuestan a sí mismos en lugar de preferir más sobre menos. El estándar de castigar al oponente se puede usar tanto en juegos de suma cero (por ejemplo, juegos de guerra, ajedrez) como en juegos de suma distinta de cero (por ejemplo, juegos de selección de fondos). El jugador en el juego tiene un deseo bastante simple de maximizar la ganancia para él, y el oponente desea minimizarla.

Solución

Para los juegos finitos de suma cero de dos jugadores, los diferentes conceptos de solución de la teoría del juego del equilibrio de Nash, minimax y maximin dan la misma solución. Si a los jugadores se les permite jugar una estrategia mixta, el juego siempre tiene un equilibrio.

Ejemplo

Un juego de suma cero (Dos personas)
Azul
Rojo
ABC
1
−30
30
10
−10
20 - 20
20
2
10
−10
20 - 20
20
20
20 - 20

La matriz de pagos de un juego es una representación conveniente. Considere estas situaciones como un ejemplo, el juego de suma cero para dos jugadores que se muestra a la derecha o arriba.

El orden de juego es el siguiente: El primer jugador (rojo) elige en secreto una de las dos acciones 1 o 2; el segundo jugador (azul), sin darse cuenta de la elección del primer jugador, elige en secreto una de las tres acciones A, B o C. Luego, las elecciones se revelan y el total de puntos de cada jugador se ve afectado según a la recompensa por esas elecciones.

Ejemplo: Rojo elige la acción 2 y Azul elige la acción B. Cuando se asigna el pago, Rojo gana 20 puntos y Azul pierde 20 puntos.

En este juego de ejemplo, ambos jugadores conocen la matriz de pagos e intentan maximizar la cantidad de sus puntos. Red podría razonar de la siguiente manera: "Con la acción 2, puedo perder hasta 20 puntos y puedo ganar solo 20, y con la acción 1 puedo perder solo 10 pero puedo ganar hasta 30, por lo que la acción 1 se ve mucho mejor." Con un razonamiento similar, Azul elegiría la acción C. Si ambos jugadores realizan estas acciones, Rojo ganará 20 puntos. Si Azul anticipa el razonamiento de Rojo y la elección de la acción 1, Azul puede elegir la acción B para ganar 10 puntos. Si Rojo, a su vez, se anticipa a este truco y va por la acción 2, este gana Rojo 20 puntos.

Émile Borel y John von Neumann tuvieron la idea fundamental de que la probabilidad proporciona una salida a este enigma. En lugar de decidir qué acción concreta tomar, los dos jugadores asignan probabilidades a sus respectivas acciones y luego usan un dispositivo aleatorio que, de acuerdo con estas probabilidades, elige una acción para ellos. Cada jugador calcula las probabilidades para minimizar la máxima pérdida de puntos esperada independientemente de la estrategia del oponente. Esto conduce a un problema de programación lineal con las estrategias óptimas para cada jugador. Este método minimax puede calcular estrategias probablemente óptimas para todos los juegos de suma cero de dos jugadores.

Para el ejemplo anterior, resulta que Red debería elegir la acción 1 con probabilidad 4/7 y acción 2 con probabilidad 3/7, y Blue debe asignar las probabilidades 0, 4/7 y 3 //span>7 a las tres acciones A, B y C. Entonces el rojo ganará 20/7 puntos de media por juego.

Resolver

El equilibrio de Nash para un juego de suma cero para dos jugadores se puede encontrar resolviendo un problema de programación lineal. Supongamos que un juego de suma cero tiene una matriz de pagos M donde el elemento Mi,j es el pago obtenido cuando el jugador que minimiza elige la estrategia pura estilo i y el jugador que maximiza elige la estrategia pura j (es decir, el jugador tratando de minimizar el pago elige la fila y el jugador que intenta maximizar el pago elige la columna). Suponga que todos los elementos de M son positivos. El juego tendrá al menos un equilibrio de Nash. El equilibrio de Nash se puede encontrar (Raghavan 1994, p. 740) resolviendo el siguiente programa lineal para encontrar un vector u:

Minimizar:

.. iui{displaystyle sum _{i}u_{i}}
Sujeto a las limitaciones:

u ≥ 0
M u ≥ 1.

La primera restricción dice que cada elemento del vector u debe ser no negativo, y la segunda restricción dice que cada elemento del M u el vector debe ser al menos 1. Para el resultado u vector, el inverso de la suma de sus elementos es el valor del juego. Multiplicar u por ese valor da un vector de probabilidad, que da la probabilidad de que el jugador que maximiza elija cada estrategia pura posible.

Si la matriz del juego no tiene todos los elementos positivos, agregue una constante a cada elemento que sea lo suficientemente grande para que todos sean positivos. Eso aumentará el valor del juego en esa constante y no afectará las estrategias mixtas de equilibrio para el equilibrio.

La estrategia mixta de equilibrio para el jugador que minimiza se puede encontrar resolviendo el dual del programa lineal dado. Alternativamente, se puede encontrar utilizando el procedimiento anterior para resolver una matriz de pagos modificada que es la transposición y la negación de M (agregando una constante por lo que es positivo), luego resolver el juego resultante.

Si se encuentran todas las soluciones del programa lineal, constituirán todos los equilibrios de Nash para el juego. Por el contrario, cualquier programa lineal se puede convertir en un juego de suma cero para dos jugadores mediante el uso de un cambio de variables que lo pone en la forma de las ecuaciones anteriores y, por lo tanto, tales juegos son equivalentes a los programas lineales, en general.

Solución universal

Si evitar un juego de suma cero es una opción de acción con cierta probabilidad para los jugadores, evitar es siempre una estrategia de equilibrio para al menos un jugador en un juego de suma cero. Para cualquier juego de suma cero de dos jugadores en el que un empate de cero a cero es imposible o no creíble después de que se inicia el juego, como el póquer, no existe una estrategia de equilibrio de Nash que no sea evitar el juego. Incluso si hay un empate cero-cero creíble después de que se inicia un juego de suma cero, no es mejor que la estrategia de evitar. En este sentido, es interesante encontrar que la recompensa sobre la marcha en el cálculo de la elección óptima prevalecerá sobre todos los juegos de suma cero de dos jugadores con respecto a comenzar o no el juego.

El ejemplo más común o simple del subcampo de la psicología social es el concepto de "trampas sociales". En algunos casos, perseguir el interés personal individual puede mejorar el bienestar colectivo del grupo, pero en otras situaciones, todas las partes que persiguen el interés personal dan como resultado un comportamiento mutuamente destructivo.

La revisión de Copeland señala que un juego de suma distinta de cero de n jugadores se puede convertir en un juego de suma cero de (n+1) jugadores, donde el jugador n+1, denota el jugador ficticio, recibe el negativo de la suma de las ganancias de los otros n-jugadores (la ganancia/pérdida global).

Juegos de tres personas de suma cero

Zero-sum three-person game

Está claro que existen múltiples relaciones entre los jugadores en un juego de tres personas de suma cero, en un juego de dos personas de suma cero, todo lo que gana un jugador lo pierde necesariamente el otro y viceversa; por lo tanto, siempre hay un antagonismo absoluto de intereses, y eso es similar en el juego de tres personas. Se supondría que un movimiento particular de un jugador en un juego de tres personas de suma cero es claramente beneficioso para él y puede perjudicar a los otros dos jugadores, o beneficiar a uno y perjudicar al otro oponente. Particularmente, el paralelismo de intereses entre dos jugadores hace deseable una cooperación; puede suceder que un jugador tenga que elegir entre varias políticas: Entrar en un interés de paralelismo con otro jugador ajustando su conducta, o lo contrario; que puede elegir con cuál de los otros dos jugadores prefiere construir tal paralelismo, y en qué medida. La imagen de la izquierda muestra un ejemplo típico de un juego de tres personas de suma cero. Si el Jugador 1 elige defender, pero el Jugador 2 & 3 elige ofender, ambos ganarán un punto. Al mismo tiempo, el jugador 2 perderá dos puntos porque otros jugadores le quitan puntos, y es evidente que el jugador 2 & 3 tiene paralelismo de intereses.

Ejemplo de la vida real

Beneficios económicos de las aerolíneas de bajo costo en mercados saturados: beneficios netos o un juego de suma cero

Los estudios muestran que la entrada de aerolíneas de bajo costo en el mercado de Hong Kong generó $671 millones en ingresos y resultó en una salida de $294 millones.

Por lo tanto, se debe considerar el efecto de reemplazo al introducir un nuevo modelo, lo que conducirá a una fuga e inyección económica. Por lo tanto, la introducción de nuevos modelos requiere precaución. Por ejemplo, si el número de nuevas aerolíneas que salen y llegan al aeropuerto es el mismo, la contribución económica a la ciudad anfitriona puede ser un juego de suma cero. Porque para Hong Kong, el consumo de los turistas extranjeros en Hong Kong es un ingreso, mientras que el consumo de los residentes de Hong Kong en ciudades opuestas es una salida. Además, la introducción de nuevas aerolíneas también puede tener un impacto negativo en las aerolíneas existentes.

En consecuencia, cuando se introduce un nuevo modelo de aviación, es necesario realizar pruebas de viabilidad en todos los aspectos, teniendo en cuenta los efectos económicos de entrada y salida y desplazamiento que provoca el modelo.

Complejidad

Robert Wright ha teorizado en su libro Nonzero: The Logic of Human Destiny, que la sociedad se vuelve cada vez más distinta de la suma cero a medida que se vuelve más compleja, especializada e interdependiente.

Extensiones

En 1944, John von Neumann y Oskar Morgenstern demostraron que cualquier juego de suma distinta de cero para n jugadores es equivalente a un juego de suma cero con n + 1 jugadores; el (n + 1) jugador que representa la ganancia o pérdida global.

Malentendidos

Los críticos de la teoría de juegos suelen malinterpretar los juegos de suma cero y, en particular, sus soluciones, generalmente con respecto a la independencia y la racionalidad de los jugadores, así como a la interpretación de las funciones de utilidad. Además, la palabra "juego" no implica que el modelo sea válido solo para juegos recreativos.

La política a veces se denomina suma cero porque, en el uso común, la idea de un punto muerto se percibe como "suma cero"; Sin embargo, la política y la macroeconomía no son juegos de suma cero, porque no constituyen sistemas conservados.

Pensamiento de suma cero

En psicología, el pensamiento de suma cero se refiere a la percepción de que una situación dada es como un juego de suma cero, donde la ganancia de una persona es igual a la pérdida de otra.