Teoría evolutiva de juegos

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

La teoría evolutiva de juegos es la aplicación de la teoría de juegos a poblaciones en evolución en biología. Define un marco de concursos, estrategias y análisis en el que se puede modelar la competencia darwiniana. Se originó en 1973 con la formalización de los concursos de John Maynard Smith y George R. Price, analizados como estrategias y los criterios matemáticos que se pueden usar para predecir los resultados de las estrategias competitivas.

La teoría de juegos evolutiva difiere de la teoría de juegos clásica en que se centra más en la dinámica del cambio de estrategia. Esto está influenciado por la frecuencia de las estrategias competidoras en la población.

La teoría evolutiva de juegos ha ayudado a explicar la base de los comportamientos altruistas en la evolución darwiniana. A su vez, se ha vuelto de interés para economistas, sociólogos, antropólogos y filósofos.

Historia

Teoría de juegos clásica

La teoría clásica de los juegos no cooperativos fue concebida por John von Neumann para determinar las estrategias óptimas en las competiciones entre adversarios. Un concurso involucra a los jugadores, todos los cuales pueden elegir sus movimientos. Los juegos pueden ser de una sola ronda o repetitivos. El enfoque que adopta un jugador al realizar sus movimientos constituye su estrategia. Las reglas gobiernan el resultado de los movimientos realizados por los jugadores, y los resultados producen ganancias para los jugadores; Las reglas y los pagos resultantes se pueden expresar como árboles de decisión o en una matriz de pagos. La teoría clásica requiere que los jugadores tomen decisiones racionales. Cada jugador debe considerar el análisis estratégico que sus oponentes están haciendo para elegir sus propios movimientos.

El problema del comportamiento ritualizado

La teoría evolutiva de juegos comenzó con el problema de cómo explicar el comportamiento animal ritualizado en una situación de conflicto; "¿Por qué los animales son tan 'caballeros o damas' en los concursos por recursos?" Los destacados etólogos Niko Tinbergen y Konrad Lorenz propusieron que tal comportamiento existe en beneficio de la especie. John Maynard Smith consideró incompatible con el pensamiento darwiniano, donde la selección se produce a nivel individual, por lo que se premia el interés propio y no la búsqueda del bien común. Maynard Smith, un biólogo matemático, recurrió a la teoría de juegos como sugirió George Price, aunque los intentos de Richard Lewontin de usar la teoría habían fallado.

Adaptación de la teoría de juegos a los juegos evolutivos

Maynard Smith se dio cuenta de que una versión evolutiva de la teoría de juegos no requiere que los jugadores actúen racionalmente, solo que tengan una estrategia. Los resultados de un juego muestran cuán buena fue esa estrategia, al igual que la evolución prueba estrategias alternativas para la capacidad de sobrevivir y reproducirse. En biología, las estrategias son rasgos heredados genéticamente que controlan la acción de un individuo, de manera análoga a los programas de computadora. El éxito de una estrategia está determinado por qué tan buena es la estrategia en presencia de estrategias competidoras (incluida ella misma) y de la frecuencia con la que se usan esas estrategias. Maynard Smith describió su trabajo en su libro Evolution and the Theory of Games.

Los participantes tienen como objetivo producir tantas réplicas de sí mismos como puedan, y la recompensa es en unidades de aptitud (valor relativo de poder reproducirse). Siempre es un juego multijugador con muchos competidores. Las reglas incluyen la dinámica del replicador, en otras palabras, cómo los jugadores más aptos generarán más réplicas de sí mismos en la población y cómo se seleccionarán los menos aptos, en una ecuación de replicador. La dinámica del replicador modela la herencia pero no la mutación, y asume la reproducción asexual en aras de la simplicidad. Los juegos se ejecutan de forma repetitiva sin condiciones de terminación. Los resultados incluyen la dinámica de los cambios en la población, el éxito de las estrategias y cualquier estado de equilibrio alcanzado. A diferencia de la teoría de juegos clásica, los jugadores no eligen su estrategia y no pueden cambiarla:

Juegos evolutivos

Modelos

La teoría evolutiva del juego abarca la evolución darwiniana, incluida la competencia (el juego), la selección natural (dinámica del replicador) y la herencia. La teoría de los juegos evolutivos ha contribuido a la comprensión de la selección de grupos, la selección sexual, el altruismo, el cuidado de los padres, la coevolución y la dinámica ecológica. Muchas situaciones contrarias a la intuición en estas áreas se han puesto sobre una base matemática firme mediante el uso de estos modelos.

La forma común de estudiar la dinámica evolutiva en los juegos es a través de ecuaciones de replicación. Estos muestran la tasa de crecimiento de la proporción de organismos que utilizan una determinada estrategia y esa tasa es igual a la diferencia entre el pago promedio de esa estrategia y el pago promedio de la población en su conjunto.Las ecuaciones del replicador continuo suponen poblaciones infinitas, tiempo continuo, mezcla completa y que las estrategias se cumplen. Los atractores (puntos fijos estables) de las ecuaciones son equivalentes a estados evolutivamente estables. Una estrategia que puede sobrevivir a todas las estrategias "mutantes" se considera evolutivamente estable. En el contexto del comportamiento animal, esto generalmente significa que tales estrategias están programadas y fuertemente influenciadas por la genética, lo que hace que la estrategia de cualquier jugador u organismo esté determinada por estos factores biológicos.

Los juegos evolutivos son objetos matemáticos con diferentes reglas, pagos y comportamientos matemáticos. Cada "juego" representa diferentes problemas a los que se enfrentan los organismos y las estrategias que pueden adoptar para sobrevivir y reproducirse. Los juegos evolutivos a menudo reciben nombres coloridos e historias de portada que describen la situación general de un juego en particular. Los juegos representativos incluyen halcón-paloma, guerra de desgaste, caza del ciervo, productor-gorrón, tragedia de los comunes y dilema del prisionero. Las estrategias para estos juegos incluyen halcón, paloma, burgués, probador, desertor, asesor y vengador. Las diversas estrategias compiten bajo las reglas del juego en particular, y las matemáticas se utilizan para determinar los resultados y comportamientos.

Paloma halcón

El primer juego que analizó Maynard Smith es el clásico juego de la paloma del halcón. Fue concebido para analizar el problema de Lorenz y Tinbergen, una competencia por un recurso compartible. Los concursantes pueden ser un halcón o una paloma. Estos son dos subtipos o morfos de una especie con diferentes estrategias. El halcón primero muestra agresión, luego se convierte en una pelea hasta que gana o se lesiona (pierde). La paloma primero muestra agresión, pero si se enfrenta a una escalada importante, corre por seguridad. Si no se enfrenta a tal escalada, la paloma intenta compartir el recurso.

conoce a halcónse encuentra con la paloma
si halconV/2 − C/2V
si paloma0V/2

Dado que al recurso se le da el valor V, el daño por perder una pelea tiene un costo C:

  • Si un halcón se encuentra con una paloma, el halcón obtiene el recurso completo V
  • Si un halcón se encuentra con un halcón, la mitad de las veces ganan, la mitad de las veces pierden, por lo que el resultado promedio es entonces V/2 menos C/2
  • Si una paloma se encuentra con un halcón, la paloma retrocederá y no conseguirá nada – 0
  • Si una paloma se encuentra con otra paloma, ambas comparten el recurso y obtienen V/2

El pago real, sin embargo, depende de la probabilidad de encontrarse con un halcón o una paloma, que a su vez es una representación del porcentaje de halcones y palomas en la población cuando se lleva a cabo un concurso en particular. Eso, a su vez, está determinado por los resultados de todos los concursos anteriores. Si el costo de perder C es mayor que el valor de ganar V (la situación normal en el mundo natural), las matemáticas terminan en una estrategia evolutivamente estable (ESS), una combinación de las dos estrategias donde la población de halcones es V/C. La población retrocede a este punto de equilibrio si cualquier halcón o paloma nueva produce una perturbación temporal en la población. La solución del juego del halcón y la paloma explica por qué la mayoría de los concursos de animales implican solo comportamientos de lucha rituales en los concursos en lugar de batallas directas. El resultado no depende en absoluto de "

Guerra de desgaste

En el juego de la paloma del halcón, el recurso se puede compartir, lo que da beneficios a ambas palomas que se encuentran en una competencia por parejas. Cuando el recurso no se puede compartir, pero un recurso alternativo podría estar disponible retrocediendo e intentando en otro lugar, las estrategias puras de halcón o paloma son menos efectivas. Si un recurso que no se puede compartir se combina con un alto costo de perder un concurso (lesiones o posible muerte), los beneficios tanto del halcón como de la paloma se reducen aún más. Entonces es viable una estrategia más segura de mostrar un costo más bajo, farolear y esperar a ganar: una estrategia de faroleo. El juego entonces se convierte en uno de costos acumulativos, ya sea los costos de exhibir o los costos de compromisos prolongados no resueltos. Es efectivamente una subasta; el ganador es el concursante que se tragará el mayor costo mientras que el perdedor obtiene el mismo costo que el ganador pero ningún recurso.Las matemáticas de la teoría evolutiva de juegos resultantes conducen a una estrategia óptima de farol cronometrado.

Esto se debe a que en la guerra de desgaste cualquier estrategia que sea inquebrantable y predecible es inestable, porque en última instancia será desplazada por una estrategia mutante que se basa en el hecho de que puede mejorar la estrategia predecible existente invirtiendo un delta extra pequeño de recursos de espera. para asegurarse de que gana. Por lo tanto, solo una estrategia aleatoria e impredecible puede mantenerse en una población de faroleros. De hecho, los concursantes eligen un costo aceptable en el que incurrir en relación con el valor del recurso que buscan, haciendo efectivamente una oferta aleatoria como parte de una estrategia mixta (una estrategia en la que un concursante tiene varias, o incluso muchas, acciones posibles en su estrategia).). Esto implementa una distribución de ofertas para un recurso de valor específico V, donde la oferta para cualquier concurso específico se elige al azar de esa distribución.Parker y Thompson determinaron que la función de distribución en estos concursos era:{displaystyle p(x)={frac {e^{-x/V}}{V}}.}

El resultado es que la población acumulada de abandonos para cualquier costo particular m en esta solución de "estrategia mixta" es:{displaystyle p(m)=1-e^{-m/V},}

como se muestra en el gráfico adyacente. Se confirma la sensación intuitiva de que mayores valores de recursos buscados conducen a mayores tiempos de espera. Esto se observa en la naturaleza, como en las moscas coprófagas machos que compiten por los sitios de apareamiento, donde el momento de la desconexión en los concursos es el predicho por las matemáticas de la teoría evolutiva.

Asimetrías que permiten nuevas estrategias

En la guerra de desgaste no debe haber nada que indique el tamaño de una oferta a un oponente, de lo contrario, el oponente puede usar la señal en una contraestrategia efectiva. Sin embargo, existe una estrategia mutante que puede mejorar a un farolero en el juego de la guerra de desgaste si existe una asimetría adecuada, la estrategia burguesa. Bourgeois usa una asimetría de algún tipo para romper el punto muerto. En la naturaleza, una de esas asimetrías es la posesión de un recurso. La estrategia es jugar un halcón si está en posesión del recurso, pero mostrar y luego retirarse si no está en posesión. Esto requiere una mayor capacidad cognitiva que el halcón, pero el burgués es común en muchos concursos de animales, como en los concursos entre camarones mantis y entre mariposas de madera moteada.

Comportamiento social

Los juegos como el halcón, la paloma y la guerra de desgaste representan una competencia pura entre individuos y no tienen elementos sociales concomitantes. Donde se aplican las influencias sociales, los competidores tienen cuatro alternativas posibles para la interacción estratégica. Esto se muestra en la figura adyacente, donde un signo más representa un beneficio y un signo menos representa un costo.

  • En una relación cooperativa o mutualista, tanto el "donante" como el "receptor" son casi indistinguibles, ya que ambos obtienen un beneficio en el juego al cooperar, es decir, la pareja se encuentra en una situación de juego en la que ambos pueden ganar al ejecutar una determinada estrategia. o, alternativamente, ambos deben actuar de forma concertada debido a algunas limitaciones generales que los colocan efectivamente "en el mismo barco".
  • En una relación altruista, el donante, a costa de sí mismo, proporciona un beneficio al receptor. En el caso general, el receptor tendrá una relación de parentesco con el donante y la donación es unidireccional. Los comportamientos en los que los beneficios se donan alternativamente (en ambas direcciones) a un costo, a menudo se denominan "altruistas", pero en el análisis se puede ver que dicho "altruismo" surge de estrategias "egoístas" optimizadas.
  • El rencor es esencialmente una forma "invertida" de altruismo en la que se ayuda a un aliado dañando a los competidores del aliado. El caso general es que el aliado está relacionado con el parentesco y el beneficio es un entorno competitivo más fácil para el aliado. Nota: George Price, uno de los primeros modeladores matemáticos tanto del altruismo como del rencor, encontró esta equivalencia particularmente inquietante a nivel emocional.
  • El egoísmo es el criterio básico de toda elección estratégica desde la perspectiva de la teoría del juego: las estrategias que no están dirigidas a la supervivencia y la autorreplicación no son largas para ningún juego. Sin embargo, esta situación se ve afectada críticamente por el hecho de que la competencia se lleva a cabo en múltiples niveles, es decir, a nivel genético, individual y grupal.

Concursos de genes egoístas

A primera vista puede parecer que los concursantes de los juegos evolutivos son los individuos presentes en cada generación que participan directamente en el juego. Pero los individuos viven solo a través de un ciclo de juego y, en cambio, son las estrategias las que realmente compiten entre sí durante la duración de estos juegos de muchas generaciones. Entonces, en última instancia, son los genes los que juegan un concurso completo: los genes egoístas de la estrategia. Los genes en disputa están presentes en un individuo y hasta cierto punto en todos los parientes del individuo. Esto a veces puede afectar profundamente qué estrategias sobreviven, especialmente con problemas de cooperación y deserción. William Hamilton, conocido por su teoría de la selección de parentesco, exploró muchos de estos casos utilizando modelos de teoría de juegos. Tratamiento relacionado con el parentesco de los concursos de juegosayuda a explicar muchos aspectos del comportamiento de los insectos sociales, el comportamiento altruista en las interacciones entre padres e hijos, los comportamientos de protección mutua y el cuidado cooperativo de la descendencia. Para tales juegos, Hamilton definió una forma extendida de fitness: fitness inclusivo, que incluye la descendencia de un individuo, así como cualquier equivalente de descendencia que se encuentre en los parientes.

Las matemáticas de la selección de parentesco
El concepto de selección de parentesco es que:aptitud inclusiva=contribución propia a la aptitud + contribución de todos los familiares.El estado físico se mide en relación con la población promedio; por ejemplo, aptitud = 1 significa crecimiento a la tasa promedio de la población, aptitud < 1 significa tener una participación decreciente en la población (desapareciendo), aptitud > 1 significa una participación creciente en la población (tomar el control).La aptitud inclusiva de un individuo w i es la suma de su aptitud específica de sí mismo a i más la aptitud específica de todos y cada uno de los relativos ponderada por el grado de relación que equivale a la suma de todos los r j * b j....... donde r j es el parentesco de un pariente específico y b j es la aptitud de ese pariente específico, produciendo:w_{i}=a_{i}+sum_{{j}}r_{j}b_{j}.Si el individuo a i sacrifica su "propio fitness promedio equivalente de 1" al aceptar un costo de fitness C, y luego "recuperar esa pérdida", w i aún debe ser 1 (o mayor que 1)... y usar R* B para representar los resultados de la suma en:1< (1-C)+RB....o reordenando..... R>C/B.

Hamilton fue más allá de la relación de parentesco para trabajar con Robert Axelrod, analizando los juegos de cooperación en condiciones que no involucraban a los parientes donde entraba en juego el altruismo recíproco.

Eusocialidad y selección de parentesco

Los trabajadores de insectos eusociales pierden los derechos reproductivos de su reina. Se ha sugerido que la selección de parentesco, basada en la composición genética de estos trabajadores, puede predisponerlos a comportamientos altruistas. La mayoría de las sociedades de insectos eusociales tienen una determinación sexual haplodiploide, lo que significa que los trabajadores están inusualmente relacionados.

Sin embargo, esta explicación de la eusocialidad de los insectos ha sido cuestionada por algunos teóricos de juegos evolutivos muy destacados (Nowak y Wilson) que han publicado una controvertida explicación teórica de juegos alternativa basada en un desarrollo secuencial y efectos de selección de grupo propuestos para estas especies de insectos.

El dilema del prisionero

Una dificultad de la teoría de la evolución, reconocida por el propio Darwin, era el problema del altruismo. Si la base de la selección es a nivel individual, el altruismo no tiene ningún sentido. Pero la selección universal a nivel de grupo (por el bien de la especie, no del individuo) no pasa la prueba de las matemáticas de la teoría de juegos y ciertamente no es el caso general en la naturaleza. Sin embargo, en muchos animales sociales existe un comportamiento altruista. La solución a este problema se puede encontrar en la aplicación de la teoría de juegos evolutiva al juego del dilema del prisionero, un juego que prueba los beneficios de cooperar o abandonar la cooperación. Es el juego más estudiado de toda la teoría de juegos.

El análisis del dilema del prisionero es como un juego repetitivo. Esto brinda a los competidores la posibilidad de tomar represalias por la deserción en rondas anteriores del juego. Se han probado muchas estrategias; las mejores estrategias competitivas son la cooperación general, con una respuesta de represalia reservada si es necesario. El más famoso y uno de los más exitosos es ojo por ojo con un algoritmo simple.

def  tit_for_tat (last_move_by_opponent): 
    """Abandonar si el oponente deserta, sino cooperar.""" 
    if  last_move_by_opponent  ==  defecto: 
        defecto () 
    else : 
        cooperar ()

El pago de cualquier ronda individual del juego está definido por la matriz de pagos para un juego de ronda individual (que se muestra en el gráfico de barras 1 a continuación). En los juegos de rondas múltiples, las diferentes opciones (cooperar o desertar) se pueden hacer en cualquier ronda en particular, lo que da como resultado un pago de ronda determinado. Sin embargo, son los posibles pagos acumulados en las múltiples rondas los que cuentan para dar forma a los pagos generales para diferentes estrategias de múltiples rondas, como ojo por ojo.

Ejemplo 1: El sencillo juego del dilema del prisionero de una sola ronda. Los pagos del clásico juego del dilema del prisionero dan al jugador un pago máximo si deserta y su compañero coopera (esta elección se conoce como tentación). Sin embargo, si el jugador coopera y su compañero deserta, obtienen el peor resultado posible (la recompensa de los tontos). En estas condiciones de pago, la mejor opción (un equilibrio de Nash) es desertar.

Ejemplo 2: El dilema del prisionero se reproduce repetidamente. La estrategia empleada es ojo por ojo, que altera los comportamientos en función de la acción realizada por un compañero en la ronda anterior, es decir, premiar la cooperación y castigar la deserción. El efecto de esta estrategia en el pago acumulado durante muchas rondas es producir un pago más alto por la cooperación de ambos jugadores y un pago más bajo por la deserción. Esto elimina la tentación de desertar. La recompensa de los tontos también se vuelve menor, aunque la "invasión" por una estrategia de deserción pura no se elimina por completo.

Rutas hacia el altruismo

El altruismo tiene lugar cuando un individuo, a un costo (C) para sí mismo, ejerce una estrategia que proporciona un beneficio (B) a otro individuo. El costo puede consistir en una pérdida de capacidad o recurso que ayuda en la batalla por la supervivencia y la reproducción, o un riesgo adicional para su propia supervivencia. Las estrategias de altruismo pueden surgir a través de:

EscribeSe aplica a:Situaciónefecto matematico
Selección de parentesco - (aptitud inclusiva de concursantes relacionados)Parientes: individuos relacionados genéticamenteLos participantes del juego evolutivo son genes de estrategia. La mejor recompensa para un individuo no es necesariamente la mejor recompensa para el gen. En cualquier generación, el gen del jugador no está solo en un individuo, está en un grupo de parentesco. La selección natural selecciona el pago de aptitud más alto para el grupo de parentesco. Por lo tanto, las estrategias que incluyen el autosacrificio por parte de los individuos a menudo son ganadoras del juego: la estrategia evolutivamente estable. Los animales deben vivir en grupos de parentesco durante parte del juego para tener la oportunidad de que este sacrificio altruista tenga lugar.Los juegos deben tener en cuenta el fitness inclusivo. La función de aptitud es la aptitud combinada de un grupo de participantes emparentados, cada uno ponderado por el grado de parentesco, en relación con la población genética total. El análisis matemático de esta visión del juego centrada en los genes conduce a la regla de Hamilton, que la relación del donante altruista debe exceder la relación costo-beneficio del acto altruista en sí mismo:R>c/b R es relación, c el costo, b el beneficio
reciprocidad directaConcursantes que intercambian favores en relaciones de parejaUna encarnación teórica del juego de "Te rasco la espalda si me rascas la mía". Un par de personas intercambian favores en un juego de varias rondas. Los individuos son reconocibles entre sí como asociados. El término "directo" se aplica porque el favor de devolución se devuelve específicamente solo a la pareja.Las características del juego de rondas múltiples producen un peligro de deserción y los beneficios potencialmente menores de la cooperación en cada ronda, pero tal deserción puede conducir a un castigo en una ronda siguiente, estableciendo el juego como un dilema del prisionero repetido. Por lo tanto, la familia de estrategias de ojo por ojo pasa a primer plano.
reciprocidad indirectaLos concursantes relacionados o no relacionados intercambian favores pero sin asociarse. Un favor de devolución está "implícito" pero sin una fuente específica identificada que lo va a dar.El favor de devolución no se deriva de ningún socio establecido en particular. El potencial de reciprocidad indirecta existe para un organismo específico si vive en un grupo de individuos que pueden interactuar durante un período prolongado de tiempo.Se ha argumentado que los comportamientos humanos al establecer sistemas morales, así como el gasto de energías significativas en la sociedad humana para rastrear las reputaciones individuales, es un efecto directo de la dependencia de las sociedades en estrategias de reciprocidad indirecta.El juego es muy susceptible a la deserción, ya que las represalias directas son imposibles. Por lo tanto, la reciprocidad indirecta no funcionará sin llevar un puntaje social, una medida del comportamiento cooperativo pasado. Las matemáticas conducen a una versión modificada de la regla de Hamilton donde:q>c/b donde q (la probabilidad de conocer el puntaje social) debe ser mayor que la relación costo beneficioLos organismos que utilizan la puntuación social se denominan Discriminadores y requieren un mayor nivel de cognición que las estrategias de simple reciprocidad directa. Como dijo el biólogo evolutivo David Haig: "Para la reciprocidad directa se necesita un rostro; para la reciprocidad indirecta se necesita un nombre".

La estrategia evolutivamente estable

La estrategia evolutivamente estable (ESS) es similar al equilibrio de Nash en la teoría de juegos clásica, pero con criterios matemáticamente extendidos. El equilibrio de Nash es un equilibrio de juego en el que no es racional que ningún jugador se desvíe de su estrategia actual, siempre que los demás se adhieran a sus estrategias. Un ESS es un estado de la dinámica del juego en el que, en una población muy grande de competidores, otra estrategia mutante no puede ingresar con éxito a la población para perturbar la dinámica existente (que a su vez depende de la mezcla de la población). Por lo tanto, una estrategia exitosa (con un ESS) debe ser efectiva contra los competidores cuando es raro (para ingresar a la población competidora anterior) y exitosa cuando más tarde en una alta proporción en la población (para defenderse).

Un ESS no es:

  • Una estrategia óptima: eso maximizaría la aptitud, y muchos estados de ESS están muy por debajo de la aptitud máxima alcanzable en un panorama de aptitud. (Vea el gráfico de halcón y paloma anterior como un ejemplo de esto).
  • Una solución singular: a menudo pueden existir varias condiciones ESS en una situación competitiva. Una competencia en particular puede estabilizarse en cualquiera de estas posibilidades, pero luego una perturbación importante en las condiciones puede mover la solución a uno de los estados alternativos de ESS.
  • Siempre presente: es posible que no haya ESS. Un juego evolutivo sin ESS es "piedra-tijera-papel", como se encuentra en especies como la lagartija de manchas laterales (Uta stansburiana).
  • Una estrategia imbatible: el ESS es sólo una estrategia invencible.

El estado de ESS se puede resolver explorando la dinámica del cambio de población para determinar un ESS o resolviendo ecuaciones para las condiciones de punto estacionario estable que definen un ESS. Por ejemplo, en el juego halcón-paloma podemos buscar si existe una condición de mezcla de población estática en la que la aptitud de las palomas sea exactamente la misma que la de los halcones (por lo tanto, ambos tienen tasas de crecimiento equivalentes: un punto estático).

Deje que la posibilidad de encontrarse con un halcón = p, por lo tanto, la posibilidad de encontrarse con una paloma es (1-p)

Deje que Whawk iguale el pago de hawk...

Whawk = recompensa por la posibilidad de encontrarse con una paloma + recompensa por la posibilidad de encontrarse con un halcón

Tomando los resultados de la matriz de pagos y conectándolos a la ecuación anterior:

Whalcón = V·(1-p)+(V/2-C/2)·p

Del mismo modo para una paloma:

Wpaloma = V/2·(1-p)+0·(p)

asi que....

Wpaloma = V/2·(1-p)

Igualando las dos aptitudes, halcón y paloma

V·(1-p)+(V/2-C/2)·p = V/2·(1-p)

... y resolviendo para p

p = V/C

entonces, para este "punto estático" donde el porcentaje de población es un ESS, se resuelve como ESS (porcentaje de halcón) = V/C

De manera similar, usando desigualdades, se puede demostrar que un mutante adicional de halcón o paloma que ingresa a este estado ESS eventualmente resulta en una menor aptitud para su especie, tanto un verdadero Nash como un equilibrio ESS. Este ejemplo muestra que cuando los riesgos de lesiones o muerte en combate (el costo C) es significativamente mayor que la recompensa potencial (el valor del beneficio V), la población estable se mezclará entre agresores y palomas, y la proporción de palomas excederá esa cantidad. de los agresores. Esto explica los comportamientos observados en la naturaleza.

Juegos inestables, patrones cíclicos.

Piedra Papel tijeras

Piedra papel tijera incorporada en un juego evolutivo se ha utilizado para modelar procesos naturales en el estudio de la ecología. Usando métodos de economía experimental, los científicos han utilizado juegos RPS para probar comportamientos dinámicos evolutivos sociales humanos en laboratorios. Los comportamientos cíclicos sociales, predichos por la teoría de juegos evolutivos, se han observado en varios experimentos de laboratorio.

El lagarto con manchas laterales juega el RPS y otros juegos cíclicos.

El primer ejemplo de RPS en la naturaleza se observó en el comportamiento y el color de la garganta de un pequeño lagarto del oeste de América del Norte. La lagartija con manchas laterales (Uta stansburiana) es polimórfica con tres morfos de color de garganta que siguen una estrategia de apareamiento diferente:

  • La garganta naranja es muy agresiva y opera en un gran territorio, intentando aparearse con numerosas hembras.
  • La garganta amarilla no agresiva imita las marcas y el comportamiento de las lagartijas hembras, y "furtivamente" se desliza en el territorio de la garganta naranja para aparearse con las hembras allí (apoderándose así de la población).
  • La garganta azul se aparea con una hembra y la protege cuidadosamente, lo que hace imposible que las zapatillas tengan éxito y, por lo tanto, superen su lugar en una población.

Sin embargo, las gargantas azules no pueden superar a las gargantas naranjas más agresivas. Trabajos posteriores demostraron que los machos azules son altruistas con otros machos azules, con tres características clave: señalan con el color azul, reconocen y se establecen junto a otros machos azules (no emparentados), e incluso defenderán a su pareja contra el naranja, para el muerte. Este es el sello distintivo de otro juego de cooperación que implica un efecto de barba verde.

Las hembras de una misma población tienen el mismo color de garganta, y esto afecta la cantidad de crías que producen y el tamaño de la progenie, lo que genera ciclos en la densidad, otro juego más: el juego rK. Aquí, r es el parámetro malthusiano que gobierna el crecimiento exponencial, y Kes la capacidad de carga del medio ambiente. Las hembras naranjas tienen nidadas más grandes y crías más pequeñas a las que les va bien en baja densidad. Las hembras amarillas y azules tienen nidadas más pequeñas y crías más grandes a las que les va bien en alta densidad. Esto genera ciclos perpetuos estrechamente ligados a la densidad de población. La idea de los ciclos debido a la regulación de la densidad de dos estrategias se originó con el investigador de roedores Dennis Chitty, ergo, este tipo de juegos conducen a los "ciclos de Chitty". Hay juegos dentro de juegos dentro de juegos incrustados en poblaciones naturales. Estos impulsan ciclos RPS en los machos con una periodicidad de cuatro años y ciclos rK en hembras con un período de dos años.

La situación general corresponde al juego de piedra, tijera y papel, creando un ciclo de población de cuatro años. El juego RPS en los lagartos machos con manchas laterales no tiene un ESS, pero tiene un equilibrio de Nash (NE) con órbitas infinitas alrededor del atractor NE. Después de esta investigación de lagartos con manchas laterales, se han descubierto muchos otros polimorfismos de tres estrategias en lagartos y algunos de estos tienen dinámicas RPS que fusionan el juego masculino y el juego de regulación de densidad en un solo sexo (machos). Más recientemente, se ha demostrado que los mamíferos albergan el mismo juego RPS en los machos y el mismo juego rK en las hembras, con polimorfismos en el color del pelaje y comportamientos que impulsan los ciclos. Este juego también está relacionado con la evolución del cuidado masculino en roedores y la monogamia, e impulsa las tasas de especiación. hay rkjuegos de estrategia vinculados a los ciclos de población de roedores (y ciclos de lagartos).

Cuando leyó que estos lagartos estaban esencialmente involucrados en un juego con una estructura de piedra, papel o tijera, se dice que John Maynard Smith exclamó "¡Han leído mi libro!".

Señalización, selección sexual y el principio de la minusvalía

Aparte de la dificultad de explicar cómo existe el altruismo en muchos organismos evolucionados, a Darwin también le preocupaba un segundo enigma: por qué un número significativo de especies tienen atributos fenotípicos que son evidentemente desventajosos para ellas con respecto a su supervivencia, y deberían, mediante el proceso de sección natural contra la que se debe seleccionar, por ejemplo, la estructura de plumas masiva e inconveniente que se encuentra en la cola de un pavo real. Con respecto a este tema, Darwin le escribió a un colega: "La vista de una pluma en la cola de un pavo real, cada vez que la miro, me enferma". Son las matemáticas de la teoría evolutiva de los juegos, las que no sólo han explicado la existencia del altruismo, sino que también explican la existencia totalmente contraria a la intuición de la cola del pavo real y otros impedimentos biológicos similares.

En el análisis, los problemas de la vida biológica no se diferencian en absoluto de los problemas que definen la economía: alimentación (similar a la adquisición y gestión de recursos), supervivencia (estrategia competitiva) y reproducción (inversión, riesgo y rendimiento). La teoría de juegos se concibió originalmente como un análisis matemático de los procesos económicos y, de hecho, es por eso que ha demostrado ser tan útil para explicar tantos comportamientos biológicos. Un refinamiento adicional importante del modelo de la teoría de juegos evolutiva que tiene connotaciones económicas se basa en el análisis de costos. Un modelo simple de costo asume que todos los competidores sufren la misma penalización impuesta por los costos del juego, pero este no es el caso. Los jugadores más exitosos estarán dotados o habrán acumulado una mayor "reserva de riqueza" o "asequibilidad" que los jugadores menos exitosos. Este efecto de riqueza en la teoría de juegos evolutivos se representa matemáticamente por el "potencial de retención de recursos (RHP)" y muestra que el costo efectivo para un competidor con un RHP más alto no es tan grande como para un competidor con un RHP más bajo. Dado que un individuo RHP más alto es una pareja más deseable para producir descendencia potencialmente exitosa, es lógico que con la selección sexual RHP debería haber evolucionado para ser señalado de alguna manera por los rivales competidores, y para que esto funcione, se debe hacer esta señalización.honestamente _ Amotz Zahavi ha desarrollado este pensamiento en lo que se conoce como el "principio de la desventaja", donde los competidores superiores señalan su superioridad mediante una exhibición costosa. Dado que las personas con un RHP más alto pueden permitirse una pantalla tan costosa, esta señalización es intrínsecamente honesta y el receptor de la señal puede tomarla como tal. En la naturaleza esto se ilustra más que en el costoso plumaje del pavo real. La prueba matemática del principio de la desventaja fue desarrollada por Alan Grafen utilizando modelos de teoría de juegos evolutivos.

Coevolución

Dos tipos de dinámica:

  • Juegos evolutivos que conducen a una situación estable o punto de estasis para estrategias de contienda que dan como resultado una estrategia evolutivamente estable
  • Juegos evolutivos que exhiben un comportamiento cíclico (como con el juego RPS) donde las proporciones de las estrategias contendientes cambian continuamente en el tiempo dentro de la población general

Una tercera, coevolutiva, dinámica, combina competencia intraespecífica e interespecífica. Los ejemplos incluyen la competencia depredador-presa y la coevolución huésped-parásito, así como el mutualismo. Se han creado modelos de juegos evolutivos para sistemas coevolutivos por pares y de múltiples especies. La dinámica general difiere entre los sistemas competitivos y los sistemas mutualistas.

En un sistema coevolutivo entre especies competitivo (no mutualista), las especies están involucradas en una carrera armamentista, donde las adaptaciones que son mejores para competir contra las otras especies tienden a ser preservadas. Tanto los pagos del juego como la dinámica del replicador reflejan esto. Esto lleva a una dinámica de Reina Roja en la que los protagonistas deben "correr lo más rápido que puedan para permanecer en un solo lugar".

Se han producido varios modelos de teoría de juegos evolutivos para abarcar situaciones coevolutivas. Un factor clave aplicable en estos sistemas coevolutivos es la continua adaptación de la estrategia en tales carreras armamentistas. Por lo tanto, el modelado coevolutivo a menudo incluye algoritmos genéticos para reflejar los efectos mutacionales, mientras que las computadoras simulan la dinámica del juego coevolutivo general. La dinámica resultante se estudia a medida que se modifican varios parámetros. Debido a que varias variables están en juego simultáneamente, las soluciones se convierten en el ámbito de la optimización de múltiples variables. Los criterios matemáticos para determinar los puntos estables son la eficiencia de Pareto y la dominancia de Pareto, una medida de los picos de optimización de la solución en sistemas multivariables.

Carl Bergstrom y Michael Lachmann aplican la teoría de juegos evolutivos a la división de beneficios en interacciones mutualistas entre organismos. Los supuestos darwinianos sobre la aptitud se modelan utilizando la dinámica del replicador para mostrar que el organismo que evoluciona a un ritmo más lento en una relación mutualista obtiene una parte desproporcionadamente alta de los beneficios o recompensas.

Extendiendo el modelo

Un modelo matemático que analice el comportamiento de un sistema debe ser inicialmente lo más simple posible para ayudar a desarrollar una base que comprenda los fundamentos, o "efectos de primer orden", pertenecientes a lo que se está estudiando. Con este entendimiento en su lugar, entonces es apropiado ver si otros parámetros más sutiles (efectos de segundo orden) impactan aún más los comportamientos primarios o dan forma a comportamientos adicionales en el sistema. Siguiendo el trabajo seminal de Maynard Smith en la teoría de juegos evolutivos, el tema ha tenido una serie de extensiones muy significativas que han arrojado más luz sobre la comprensión de la dinámica evolutiva, particularmente en el área de los comportamientos altruistas. Algunas de estas extensiones clave de la teoría de juegos evolutivos son:

Juegos espaciales

Los factores geográficos en la evolución incluyen el flujo de genes y la transferencia horizontal de genes. Los modelos de juegos espaciales representan la geometría colocando a los concursantes en una red de celdas: los concursos se llevan a cabo solo con vecinos inmediatos. Las estrategias ganadoras se apoderan de estos vecindarios inmediatos y luego interactúan con los vecindarios adyacentes. Este modelo es útil para mostrar cómo los bolsillos de cooperadores pueden invadir e introducir el altruismo en el juego del dilema de los prisioneros, donde ojo por ojo (TFT) es un equilibrio de Nash pero NO también un ESS. La estructura espacial a veces se abstrae en una red general de interacciones. Esta es la base de la teoría de grafos evolutivos.

Efectos de tener información

En la teoría de juegos evolutiva, como en la teoría de juegos convencional, el efecto de la señalización (la adquisición de información) es de importancia crítica, como en la reciprocidad indirecta en el dilema del prisionero (donde las contiendas entre los MISMOS individuos emparejados NO son repetitivas). Esto modela la realidad de la mayoría de las interacciones sociales normales que no están relacionadas con el parentesco. A menos que se disponga de una medida de probabilidad de reputación en Prisoners Dilemma, solo se puede lograr la reciprocidad directa. Con esta información también se admite la reciprocidad indirecta.

Alternativamente, los agentes pueden tener acceso a una señal arbitraria inicialmente no correlacionada con la estrategia, pero que se correlaciona debido a la dinámica evolutiva. Este es el efecto de barba verde (ver lagartos con manchas laterales, arriba) o la evolución del etnocentrismo en humanos. Dependiendo del juego, puede permitir la evolución de la cooperación o la hostilidad irracional.

Desde el nivel molecular al multicelular, podría ser apropiado un modelo de juego de señalización con asimetría de información entre el emisor y el receptor, como la atracción de pareja o la evolución de la maquinaria de traducción a partir de cadenas de ARN.

Poblaciones finitas

Muchos juegos evolutivos se han modelado en poblaciones finitas para ver el efecto que esto puede tener, por ejemplo, en el éxito de estrategias mixtas.

Contenido relacionado

Característica de Euler

En matemáticas, y más específicamente en topología algebraica y combinatoria poliedral, la Función de Euler es un invariante topológico, un número que...

Estructura matemática

En matemáticas, una estructura es un conjunto dotado de algunas características adicionales en el conjunto (por ejemplo, una operación, relación, métrica...

Espacio compacto

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save