Juego repetido

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En teoría de juegos, un juego repetido (o juego iterado) es un juego en forma extensiva que consta de una serie de repeticiones de algún juego base (llamado juego por etapas). ). El juego de escenario suele ser uno de los juegos de 2 personas más estudiados. Los juegos repetidos capturan la idea de que un jugador tendrá que tener en cuenta el impacto de su acción actual en las acciones futuras de otros jugadores; este impacto a veces se denomina reputación. Juego de una sola etapa o juego de un solo disparo son nombres para juegos no repetidos.

Para ver un ejemplo real de un juego repetido, considere dos gasolineras adyacentes entre sí. Compiten publicando sus precios y tienen el mismo costo marginal c constante (el precio mayorista de la gasolina). Supongamos que cuando ambos cobran p = 10, su beneficio conjunto se maximiza, lo que da como resultado un beneficio alto para todos. A pesar de que este es el mejor resultado para ellos, están motivados a desviarse. Al bajar modestamente el precio, cualquiera de los dos puede arrebatarle todo el poder a sus competidores. clientes, casi duplicando sus ingresos. P = c, donde su beneficio es cero, es el único precio sin esta desviación del beneficio. En otras palabras, en el juego de competencia de precios, el único equilibrio de Nash es ineficiente (para gasolineras) en el que ambas cobran p = c. Esto es más una regla que una excepción: en un juego por etapas, el equilibrio de Nash es el único resultado que un agente puede adquirir consistentemente en una interacción, y generalmente es ineficiente para él. Esto se debe a que los agentes sólo se preocupan por sus propios intereses personales y no les importan los beneficios o costos que sus acciones aportan a los competidores. Por otro lado, las gasolineras obtienen beneficios incluso si hay otra gasolinera adyacente. Una de las razones más cruciales es que su interacción no es única. Esta condición se representa mediante juegos repetidos, en los que dos gasolineras compiten por el precio (juegos escénicos) en un intervalo de tiempo indefinido t = 0, 1, 2,...

Juegos repetidos de forma finita o infinita

Los juegos repetidos se pueden dividir en dos clases, finitos e infinitos, dependiendo de cuánto tiempo se juegue el juego.

  • Los juegos finitos son aquellos en los que ambos jugadores saben que el juego está siendo jugado un número específico (y finito) de rondas, y que el juego termina por cierto después de que se han jugado muchas rondas. En general, los juegos finitos pueden ser resueltos por la inducción al revés.
  • Los juegos infinitos son aquellos en los que el juego está siendo jugado un número infinito de veces. Un juego con un número infinito de rondas también es equivalente (en términos de estrategias para jugar) a un juego en el que los jugadores en el juego no saben por cuántas rondas se juega el juego. Juegos infinitos (o juegos que se repiten un número desconocido de veces) no pueden ser resueltos por la inducción al revés ya que no hay "última ronda" para comenzar la inducción al revés.

Incluso si el juego que se juega en cada ronda es idéntico, repetir ese juego un número finito o infinito de veces puede, en general, conducir a resultados (equilibrios) muy diferentes, así como a estrategias óptimas muy diferentes.

Juegos repetidos infinitamente

Los juegos repetidos más estudiados son los juegos que se repiten un número infinito de veces. En los juegos iterados del dilema del prisionero, se descubre que la estrategia preferida no es jugar una estrategia de Nash del juego escénico, sino cooperar y jugar una estrategia socialmente óptima. Una parte esencial de las estrategias en un juego infinitamente repetido es castigar a los jugadores que se desvían de esta estrategia cooperativa. El castigo puede ser jugar una estrategia que conduzca a una reducción de los beneficios para ambos jugadores durante el resto del juego (llamada estrategia desencadenante). Normalmente, un jugador puede optar por actuar de forma egoísta para aumentar su propia recompensa en lugar de seguir la estrategia socialmente óptima. Sin embargo, si se sabe que el otro jugador está siguiendo una estrategia desencadenante, entonces el jugador espera recibir pagos reducidos en el futuro si se desvía en esta etapa. Una estrategia de activación eficaz garantiza que cooperar tenga más utilidad para el jugador que actuar de forma egoísta ahora y afrontar el castigo del otro jugador en el futuro.

Hay muchos resultados en teoremas que tratan de cómo lograr y mantener un equilibrio socialmente óptimo en juegos repetidos. Estos resultados se denominan colectivamente "teoremas populares". Una característica importante de un juego repetido es la forma en que se pueden modelar las preferencias de un jugador. Hay muchas maneras diferentes en las que se puede modelar una relación de preferencia en un juego infinitamente repetido, pero dos de las más importantes son:

  • Límite de los medios - Si el juego resulta en un camino de resultados y jugador i tiene la función de utilidad de juego básico , jugador i 's utilidad es:
  • Descuento - Si el jugador i's valoración del juego disminuye con el tiempo dependiendo de un factor de descuento , entonces jugador i 's utilidad es:

Para los jugadores suficientemente pacientes (por ejemplo, aquellos con valores suficientemente altos ), se puede probar que cada estrategia que tiene un pago mayor que el pago minmax puede ser un equilibrio Nash - un conjunto muy grande de estrategias.

Juegos finitamente repetidos

Los juegos repetidos permiten estudiar la interacción entre ganancias inmediatas e incentivos a largo plazo. Un juego finitamente repetido es un juego en el que el mismo juego de una etapa se juega repetidamente durante varios períodos de tiempo discretos o rondas. Cada período de tiempo está indexado por 0 < t ≤ T donde T es el número total de períodos. El pago final de un jugador es la suma de sus pagos en cada ronda.

Para aquellos juegos repetidos con un número fijo y conocido de períodos de tiempo, si el juego de etapa tiene un equilibrio de Nash único, entonces el juego repetido tiene un perfil de estrategia de equilibrio de Nash perfecto en subjuegos único para jugar el equilibrio del juego de etapa en cada ronda. Esto se puede deducir mediante inducción hacia atrás. El equilibrio de Nash del juego de etapa única debe jugarse en la última ronda independientemente de lo que sucedió en rondas anteriores. Sabiendo esto, los jugadores no tienen ningún incentivo para desviarse del equilibrio de Nash del juego de etapa única en la penúltima ronda, por lo que esta lógica se aplica nuevamente a la primera ronda del juego. Este "desentrañamiento" de un juego desde su punto final se puede observar en la paradoja de Chainstore.

Si el juego de escenario tiene más de un equilibrio de Nash, el juego repetido puede tener múltiples equilibrios de Nash perfectos en subjuegos. Si bien se debe jugar un equilibrio de Nash en la última ronda, la presencia de equilibrios múltiples introduce la posibilidad de estrategias de recompensa y castigo que pueden usarse para respaldar la desviación de los equilibrios de Nash del juego de etapa en rondas anteriores.

Por otro lado, los juegos finitamente repetidos con un número de períodos de tiempo desconocido o indeterminado se consideran como si fueran un juego infinitamente repetido. No es posible aplicar la inducción hacia atrás a estos juegos.

Ejemplos de cooperación en juegos finitamente repetidos

X Y Z
A 5 4 1, 1 2 5
B 1, 1 3 21, 1

Ejemplo 1: Juego repetido de dos etapas con múltiples equilibrios de Nash

El Ejemplo 1 muestra un juego repetido de dos etapas con múltiples equilibrios de Nash de estrategia pura. Debido a que estos equilibrios difieren marcadamente en términos de pagos para el jugador 2, el jugador 1 puede proponer una estrategia en múltiples etapas del juego que incorpore la posibilidad de castigo o recompensa para el jugador 2. Por ejemplo, el jugador 1 podría proponer que juegue (A, X) en la primera ronda. Si el jugador 2 cumple en la primera ronda, el jugador 1 lo recompensará jugando el equilibrio (A, Z) en la segunda ronda, lo que producirá una recompensa total en dos rondas de (7, 9).

Si el jugador 2 se desvía a (A, Z) en la primera ronda en lugar de jugar el (A, X) acordado, el jugador 1 puede amenazar con castigarlo jugando el equilibrio (B, Y) en la segunda ronda. Esta última situación produce beneficios (5, 7), dejando a ambos jugadores en peor situación.

De esta manera, la amenaza de castigo en una ronda futura incentiva una estrategia colaborativa y de desequilibrio en la primera ronda. Debido a que la ronda final de cualquier juego finitamente repetido, por su propia naturaleza, elimina la amenaza de castigo futuro, la estrategia óptima en la última ronda siempre será uno de los equilibrios del juego. Es el diferencial de pagos entre los equilibrios en el juego representado en el ejemplo 1 lo que hace viable una estrategia de castigo/recompensa (para más información sobre la influencia del castigo y la recompensa en la estrategia del juego, consulte "Juego de bienes públicos con castigo y recompensa"). 39;).

M N O
C 5 4 1, 1 0, 5
D 1, 1 3 21, 1

Ejemplo 2: Juego repetido de dos etapas con equilibrio de Nash único

El Ejemplo 2 muestra un juego repetido de dos etapas con un equilibrio de Nash único. Como aquí sólo hay un equilibrio, no existe ningún mecanismo para que ninguno de los jugadores amenace con un castigo o prometa una recompensa en la segunda ronda del juego. Como tal, la única estrategia que puede admitirse como equilibrio de Nash perfecto en subjuegos es la de jugar la estrategia de equilibrio de Nash única del juego (D, N) en cada ronda. En este caso, eso significa jugar (D, N) cada etapa durante dos etapas (n=2), pero sería cierto para cualquier número finito de etapas n. Para interpretar: este resultado significa que la mera presencia de un horizonte temporal conocido y finito sabotea la cooperación en cada ronda del juego. La cooperación en juegos iterados sólo es posible cuando el número de rondas es infinito o desconocido.

Resolver juegos repetidos

En general, los juegos repetidos se resuelven fácilmente utilizando estrategias proporcionadas por teoremas populares. Los juegos repetidos complejos se pueden resolver utilizando varias técnicas, la mayoría de las cuales dependen en gran medida del álgebra lineal y de los conceptos expresados en el juego ficticio. Se puede deducir que se puede determinar la caracterización de los pagos de equilibrio en juegos infinitamente repetidos. Mediante la alternancia entre dos pagos, digamos a y f, el perfil de pago promedio puede ser un promedio ponderado entre a y f.

Información incompleta

Los juegos repetidos pueden incluir información incompleta. Aumann y Maschler fueron pioneros en los juegos repetidos con información incompleta. Si bien es más fácil tratar una situación en la que un jugador está informado y el otro no, y cuando la información recibida por cada jugador es independiente, es posible abordar juegos de suma cero con información incompleta de ambos lados y señales que no son independientes. .

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save