Estrategia evolutivamente estable

Compartir Imprimir Citar
Concepto de solución en la teoría del juego

Una estrategia evolutivamente estable (ESS) es una estrategia (o conjunto de estrategias) que es impermeable cuando es adoptada por una población en adaptación a un entorno específico, es decir, no puede ser desplazado por una estrategia alternativa (o un conjunto de estrategias) que puede ser novedoso o inicialmente raro. Introducido por John Maynard Smith y George R. Price en 1972/3, es un concepto importante en ecología del comportamiento, psicología evolutiva, teoría de juegos matemáticos y economía, con aplicaciones en otros campos como la antropología, la filosofía y las ciencias políticas.

En términos de teoría de juegos, un ESS es un refinamiento de equilibrio del equilibrio de Nash, siendo un equilibrio de Nash que también es "evolutivamente estable". Por lo tanto, una vez fijada en una población, la selección natural por sí sola es suficiente para evitar que estrategias alternativas (mutantes) la reemplacen (aunque esto no excluye la posibilidad de que surja una mejor estrategia, o un conjunto de estrategias, en respuesta a las presiones selectivas resultantes de cambio medioambiental).

Historia

Las estrategias evolutivamente estables fueron definidas e introducidas por John Maynard Smith y George R. Price en un artículo de Nature de 1973. Fue tal el tiempo que se tomó en la revisión por pares del artículo para Nature que esto fue precedido por un ensayo de 1972 de Maynard Smith en un libro de ensayos titulado Sobre la evolución. A veces se cita el ensayo de 1972 en lugar del artículo de 1973, pero es mucho más probable que las bibliotecas universitarias tengan copias de Nature. Los trabajos en Nature suelen ser breves; en 1974, Maynard Smith publicó un artículo más extenso en el Journal of Theoretical Biology. Maynard Smith explica con más detalle en su libro de 1982 Evolution and the Theory of Games. A veces, estos se citan en su lugar. De hecho, el ESS se ha vuelto tan central en la teoría de juegos que a menudo no se cita, ya que se supone que el lector está familiarizado con él.

Maynard Smith formalizó matemáticamente un argumento verbal presentado por Price, que leyó mientras revisaba el artículo de Price. Cuando Maynard Smith se dio cuenta de que Price, algo desorganizado, no estaba listo para revisar su artículo para su publicación, se ofreció a agregar a Price como coautor.

El concepto se derivó del trabajo de R. H. MacArthur y W. D. Hamilton sobre proporciones de sexos, derivado del principio de Fisher, especialmente el concepto de Hamilton (1967) de una estrategia imbatible. Maynard Smith recibió conjuntamente el Premio Crafoord de 1999 por su desarrollo del concepto de estrategias evolutivamente estables y la aplicación de la teoría de juegos a la evolución del comportamiento.

Usos de ESS:

Motivación

El equilibrio de Nash es el concepto de solución tradicional en la teoría de juegos. Depende de las capacidades cognitivas de los jugadores. Se supone que los jugadores son conscientes de la estructura del juego y tratan conscientemente de predecir los movimientos de sus oponentes y de maximizar sus propios pagos. Además, se presume que todos los jugadores lo saben (ver conocimiento común). Estos supuestos se utilizan luego para explicar por qué los jugadores eligen estrategias de equilibrio de Nash.

Las estrategias evolutivamente estables tienen motivaciones completamente diferentes. Aquí, se presume que los jugadores' Las estrategias están biológicamente codificadas y son heredables. Los individuos no tienen control sobre su estrategia y no necesitan ser conscientes del juego. Se reproducen y están sujetos a las fuerzas de la selección natural, y las recompensas del juego representan el éxito reproductivo (aptitud biológica). Se imagina que ocasionalmente ocurren estrategias alternativas del juego, a través de un proceso como la mutación. Para ser un SEE, una estrategia debe ser resistente a estas alternativas.

Dadas las suposiciones motivadoras radicalmente diferentes, puede sorprender que los equilibrios de ESS y Nash coincidan a menudo. De hecho, cada ESS corresponde a un equilibrio de Nash, pero algunos equilibrios de Nash no son ESS.

Equilibrio de Nash

Un ESS es una forma refinada o modificada de un equilibrio de Nash. (Consulte la siguiente sección para ver ejemplos que contrastan los dos). En un equilibrio de Nash, si todos los jugadores adoptan sus respectivas partes, ningún jugador puede beneficiarse al cambiar a una estrategia alternativa. En un juego de dos jugadores, es un par de estrategia. Sea E(S,T) el pago por jugar la estrategia S contra la estrategia T. El par de estrategias (S, S) es un equilibrio de Nash en un juego de dos jugadores si y solo si para ambos jugadores, para cualquier estrategia T:

E(E)S,S) ≥ E(T,S)

En esta definición, una estrategia TS puede ser una alternativa neutral a S (puntuando igual de bien, pero no mejor). Se supone que un equilibrio de Nash es estable incluso si T obtiene la misma puntuación, suponiendo que no existe un incentivo a largo plazo para que los jugadores adopten T en lugar de S . Este hecho representa el punto de partida de la ESS.

Maynard Smith y Price especifican dos condiciones para que una estrategia S sea una ESS. Para todos los TS, ya sea

  1. E(E)S,S) E(E)T,S), o
  2. E(E)S,SET,S) y E(S,T) E(E)T,T)

La primera condición a veces se denomina equilibrio de Nash estricto. La segunda a veces se denomina 'segunda condición de Maynard Smith'. La segunda condición significa que aunque la estrategia T es neutral con respecto al pago contra la estrategia S, la población de jugadores que continúan jugando la estrategia S tiene ventaja cuando juega contra T.

También hay una definición alternativa más fuerte de ESS, debido a Thomas. Esto pone un énfasis diferente en el papel del concepto de equilibrio de Nash en el concepto de ESS. Siguiendo la terminología dada en la primera definición anterior, esta definición requiere que para todos los TS

  1. E(E)S,S) ≥ E(T,S), y
  2. E(E)S,T) E(E)T,T)

En esta formulación, la primera condición especifica que la estrategia es un equilibrio de Nash y la segunda especifica que se cumple la segunda condición de Maynard Smith. Tenga en cuenta que las dos definiciones no son exactamente equivalentes: por ejemplo, cada estrategia pura en el juego de coordinación a continuación es un ESS según la primera definición pero no la segunda.

En palabras, esta definición se ve así: el pago del primer jugador cuando ambos juegan la estrategia S es mayor (o igual) que el pago del primer jugador cuando cambia a otra estrategia T y el segundo jugador mantiene su estrategia S y el pago del primer jugador cuando solo su oponente cambia su estrategia a T es mayor que su pago en caso de que ambos jugadores cambien sus estrategias a T.

Esta formulación destaca más claramente el papel de la condición de equilibrio de Nash en el ESS. También permite una definición natural de conceptos relacionados, como un ESS débil o un conjunto evolutivamente estable.

Ejemplos de diferencias entre equilibrios de Nash y ESSes

Cooperate Defecto
Cooperate 3, 3 1, 4
Defecto 4, 1 2, 2
Dilema del preso
A B
A 2, 2 1, 2
B 2, 1 2, 2
Harm tu vecino

En la mayoría de los juegos simples, los equilibrios ESS y Nash coinciden perfectamente. Por ejemplo, en el dilema del prisionero solo hay un equilibrio de Nash, y su estrategia (Defecto) también es un ESS.

Algunos juegos pueden tener equilibrios de Nash que no son ESS. Por ejemplo, en daño a tu prójimo (cuya matriz de pagos se muestra aquí) tanto (A, A) como (B, B ) son equilibrios de Nash, ya que los jugadores no pueden hacerlo mejor alejándose de cualquiera de los dos. Sin embargo, solo B es un ESS (y un fuerte Nash). A no es un ESS, por lo que B puede invadir neutralmente una población de estrategas A y predominar, porque las puntuaciones B mayor contra B que A contra B. Esta dinámica es capturada por la segunda condición de Maynard Smith, ya que E(A, A) = E(B, A), pero no es el caso que E(A,B) > E(B,B).

C D
C 2, 2 1, 2
D 2, 1 0, 0
Harm todos
Swerve Quédate.
Swerve 0,0 −1,+1
Quédate. +1,-1 20 - 20
Pollo

Los equilibrios de Nash con alternativas de igual puntuación pueden ser ESS. Por ejemplo, en el juego Harm everyone, C es un ESS porque satisface la segunda condición de Maynard Smith. Los estrategas D pueden invadir temporalmente una población de estrategas C al anotar igual de bien contra C, pero pagan un precio cuando comienzan a jugar contra cada uno. otro; C puntúa mejor contra D que D. Así que aquí aunque E(C, C) = E(D, C), también es el caso que E(C,D) > E(D,D). Como resultado, C es un ESS.

Incluso si un juego tiene equilibrios de Nash de estrategia pura, es posible que ninguna de esas estrategias puras sea ESS. Considere el Juego de la gallina. Hay dos equilibrios de Nash de estrategia pura en este juego (Swerve, Stay) y (Stay, Swerve). Sin embargo, en ausencia de una asimetría no correlacionada, ni Swerve ni Stay son ESS. Hay un tercer equilibrio de Nash, una estrategia mixta que es un ESS para este juego (consulte el juego Halcón-paloma y la Mejor respuesta para obtener una explicación).

Este último ejemplo apunta a una diferencia importante entre los equilibrios de Nash y ESS. Los equilibrios de Nash se definen en conjuntos de estrategias (una especificación de una estrategia para cada jugador), mientras que los ESS se definen en términos de las propias estrategias. Los equilibrios definidos por ESS siempre deben ser simétricos y, por lo tanto, tener menos puntos de equilibrio.

Vs. estado evolutivamente estable

En biología de poblaciones, los dos conceptos de una estrategia evolutivamente estable (ESS) y un estado evolutivamente estable están estrechamente vinculados pero describen situaciones diferentes.

En una estrategia evolutivamente estable, si todos los miembros de una población la adoptan, ninguna estrategia mutante puede invadir. Una vez que prácticamente todos los miembros de la población utilizan esta estrategia, no hay forma 'racional' alternativa. ESS es parte de la teoría de juegos clásica.

En un estado evolutivamente estable, la composición genética de una población se restaura mediante selección después de una perturbación, si la perturbación no es demasiado grande. Un estado evolutivamente estable es una propiedad dinámica de una población que vuelve a usar una estrategia, o una combinación de estrategias, si es perturbada desde ese estado inicial. Es parte de la genética de poblaciones, el sistema dinámico o la teoría de juegos evolutivos. Esto ahora se llama estabilidad convergente.

B. Thomas (1984) aplica el término ESS a una estrategia individual que puede ser mixta, y un estado de población evolutivamente estable a una mezcla de población de estrategias puras que puede ser formalmente equivalente a la ESS mixta.

Que una población sea evolutivamente estable no se relaciona con su diversidad genética: puede ser genéticamente monomórfica o polimórfica.

ESE estocástico

En la definición clásica de un ESS, ninguna estrategia mutante puede invadir. En poblaciones finitas, cualquier mutante podría, en principio, invadir, aunque con baja probabilidad, lo que implica que no puede existir ningún ESS. En una población infinita, un ESS puede definirse como una estrategia que, si fuera invadida por una nueva estrategia mutante con probabilidad p, sería capaz de contrainvadir desde un solo individuo inicial con probabilidad >p, como lo ilustra la evolución de cobertura de apuestas.

El dilema de la prisionera

(feminine)
Cooperate Defecto
Cooperate 3, 3 1, 4
Defecto 4, 1 2, 2
Dilema del preso

Un modelo común de altruismo y cooperación social es el dilema del prisionero. Aquí, un grupo de jugadores estaría mejor colectivamente si pudieran jugar Cooperar, pero dado que a Abandonar le va mejor, cada jugador individual tiene un incentivo para jugar Abandonar. Una solución a este problema es introducir la posibilidad de represalias haciendo que los individuos jueguen el juego repetidamente contra el mismo jugador. En el llamado dilema del prisionero iterado, los mismos dos individuos juegan el dilema del prisionero una y otra vez. Mientras que el dilema del prisionero tiene solo dos estrategias (Cooperar y Abandonar), el dilema del prisionero iterado tiene una gran cantidad de estrategias posibles. Como un individuo puede tener un plan de contingencia diferente para cada historia y el juego puede repetirse un número indefinido de veces, de hecho puede haber un número infinito de tales planes de contingencia.

Tres planes de contingencia simples que han recibido una atención considerable son Desertar siempre, Cooperar siempre y Ojo por ojo. Las dos primeras estrategias hacen lo mismo independientemente de las acciones del otro jugador, mientras que la última responde en la siguiente ronda haciendo lo mismo que se le hizo en la ronda anterior: responde a Cooperar con Cooperar y Abandonar con Abandonar.

Si toda la población juega Tit-for-Tat y surge un mutante que juega Always Defect, Tit-for-Tat superará Defecto siempre. Si la población del mutante se vuelve demasiado grande, el porcentaje del mutante se mantendrá pequeño. Tit for Tat es por lo tanto un ESS, con respecto a solo estas dos estrategias. Por otro lado, una isla de jugadores Always Defect será estable contra la invasión de unos pocos jugadores de Tit-for-Tat, pero no contra una gran cantidad de ellos. Si introducimos Cooperar siempre, una población de Ojo por ojo ya no es un ESS. Dado que una población de jugadores Tit-for-Tat siempre coopera, la estrategia Cooperar siempre se comporta de forma idéntica en esta población. Como resultado, un mutante que juegue Cooperar siempre no será eliminado. Sin embargo, aunque una población de Coopera siempre y Ojo por ojo pueden coexistir, si hay un pequeño porcentaje de la población que Siempre deserta i>, la presión selectiva está en contra de Cooperar Siempre, ya favor de Tit-for-Tat. Esto se debe a los beneficios más bajos de cooperar que los de desertar en caso de que el oponente deserte.

Esto demuestra las dificultades para aplicar la definición formal de un ESS a juegos con grandes espacios de estrategia y ha motivado a algunos a considerar alternativas.

Comportamiento humano

Los campos de la sociobiología y la psicología evolutiva intentan explicar el comportamiento animal y humano y las estructuras sociales, en gran parte en términos de estrategias evolutivamente estables. La sociopatía (comportamiento antisocial o criminal crónico) puede ser el resultado de una combinación de dos de estas estrategias.

Las estrategias evolutivamente estables se consideraron originalmente para la evolución biológica, pero se pueden aplicar a otros contextos. De hecho, hay estados estables para una gran clase de dinámicas adaptativas. Como resultado, pueden usarse para explicar comportamientos humanos que carecen de influencias genéticas.