Conjunto de información (teoría de juegos)
El conjunto de información es la base para la toma de decisiones en un juego, que incluye las acciones disponibles para ambos lados y los beneficios de cada acción. El conjunto de información es un concepto importante en los juegos no perfectos. En teoría de juegos, un conjunto de información es el conjunto de todas las acciones posibles en el juego para un jugador determinado, basadas en sus observaciones y un conjunto para un jugador en particular que, dado lo que ese jugador ha observado, muestra los vértices de decisión disponibles para el jugador que son indistinguibles para él en el punto actual del juego. Para tener una mejor idea sobre los vértices de decisión, consulte la Figura 1. Si el juego tiene información perfecta, cada conjunto de información contiene solo un miembro, es decir, el punto realmente alcanzado en esa etapa del juego, ya que cada jugador conoce la combinación exacta de movimientos aleatorios. y estrategias del jugador hasta el punto actual del juego. De lo contrario, es posible que algunos jugadores no puedan estar seguros de cuál es el estado del juego; por ejemplo, no saber qué pasó exactamente en el pasado o qué se debe hacer ahora.

Los conjuntos de información se utilizan en juegos de formato extensivo y, a menudo, se representan en árboles de juego. Los árboles de juego muestran el camino desde el inicio de una partida y los caminos posteriores que se pueden realizar dependiendo del siguiente movimiento de cada jugador. Para problemas de juegos con información no perfecta, existe información oculta. Es decir, cada jugador no tiene un conocimiento completo de la información del oponente, como por ejemplo cartas que no aparecen en un juego de póquer. Por lo tanto, al construir un árbol de juego, es difícil determinar con precisión dónde está ubicado un nodo basándose únicamente en información conocida, ya que no conocemos cierta información sobre nuestro oponente. Sólo podemos estar seguros de que estamos en uno de varios nodos posibles. Esta incapacidad para distinguir el conjunto de nodos en el árbol de juego de un jugador en particular se conoce como "conjunto de información". Los conjuntos de información se pueden representar fácilmente en árboles de juego para mostrar los posibles movimientos de cada jugador, normalmente usando líneas de puntos, círculos o incluso simplemente etiquetando los vértices que muestran las opciones de un jugador en particular en la etapa actual del juego como se muestra en la Figura 1.
Más específicamente, en forma extensiva, un conjunto de información es un conjunto de nodos de decisión tales que:
- Cada nodo en el set pertenece a un jugador.
- Cuando el juego alcanza el conjunto de información, el jugador con el movimiento no puede diferenciar entre nodos dentro del conjunto de información, es decir, si un conjunto de información contiene múltiples nodos, los participantes asociados con ese conjunto de información son inciertos acerca de qué nodo seleccionar para su movimiento.
Los juegos en forma extensiva a menudo implican que cada jugador pueda realizar múltiples movimientos, lo que también da como resultado la formación de múltiples conjuntos de información. Un jugador debe tomar decisiones en cada uno de estos vértices basándose en las opciones del conjunto de información. Esto se conoce como estrategia del jugador y puede proporcionar el camino del jugador desde el comienzo del juego hasta el final, lo que también se conoce como el juego. A partir del desarrollo del juego, el resultado siempre se conocerá en función de la estrategia de cada jugador, a menos que haya movimientos aleatorios involucrados, entonces no siempre habrá un resultado singular. No todos los juegos se basan en estrategias, ya que también pueden implicar movimientos aleatorios. Cuando se trata de movimientos aleatorios, un vector de estrategias puede dar como resultado la distribución de probabilidad de los múltiples resultados de los juegos que podrían ocurrir. Se pueden crear múltiples resultados de juegos cuando interviene el azar, ya que es probable que los movimientos sean diferentes cada vez. Sin embargo, según la solidez de la estrategia, algunos resultados podrían tener mayores probabilidades que otros.
Asumiendo que hay múltiples conjuntos de información en un juego, el juego se transforma de un juego estático a un juego dinámico. La clave para resolver el juego dinámico es calcular el conjunto de información de cada jugador y tomar decisiones basadas en sus opciones en diferentes etapas. Por ejemplo, cuando el jugador A elige primero, el jugador B tomará la mejor decisión para él basándose en la elección de A. El jugador A, a su vez, puede predecir la reacción de B y tomar una decisión a su favor. La noción de conjunto de información fue introducida por John von Neumann, motivado por estudiar el juego de Poker.
Ejemplo


A la derecha hay dos versiones del juego de batalla de sexos, mostradas en forma extensa. A continuación, también se muestra la forma normal de ambos juegos.
El primer juego es simplemente secuencial: cuando el jugador 2 toma una decisión, ambas partes ya saben si el jugador 1 ha elegido O(pera) o F(ootball).
El segundo juego también es secuencial, pero la línea de puntos muestra el conjunto de información del jugador 2. Esta es la forma común de demostrar que cuando el jugador 2 se mueve, no es consciente de lo que hizo el jugador 1.
Esta diferencia también conduce a predicciones diferentes para los dos juegos. En el primer juego, el jugador 1 tiene la ventaja. Saben que pueden elegir O(pera) de forma segura porque una vez que el jugador 2 sabe que el jugador 1 ha elegido ópera, el jugador 2 preferiría aceptar o(pera) y obtener 2 luego elija f(ootball) y obtenga 0. Formalmente, eso es aplicar la perfección en subjuegos para resolver el juego.
En el segundo juego, el jugador 2 no puede observar lo que hizo el jugador 1, por lo que bien podría ser un juego simultáneo. Entonces, la perfección en subjuegos no nos brinda nada que el equilibrio de Nash no pueda brindarnos, y tenemos los 3 equilibrios posibles estándar:
- Ambos eligen ópera
- ambos eligen fútbol
- o ambos utilizan una estrategia mixta, con el jugador 1 elegir O(pera) 3/5 del tiempo, y el jugador 2 elegir f(ootball) 2/5 del tiempo
|
|