Equilíbrio de Nash

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

Na teoria dos jogos, o Nash Equilibrium é o conceito de solução mais comumente usado para jogos não cooperativos. Um equilíbrio de Nash é uma situação em que nenhum jogador poderia ganhar mudando sua própria estratégia (mantendo todos os outros jogadores - estratégias fixa). A idéia de Nash Equilibrium remonta à época de Cournot, que em 1838 a aplicou ao seu modelo de competição em um oligopólio.

Se cada jogador escolheu uma estratégia - um plano de ação com base no que aconteceu até agora no jogo - e ninguém pode aumentar o próprio retorno esperado, alterando a estratégia de uma delas enquanto os outros jogadores Mantenha o deles inalterado, então o conjunto atual de opções de estratégia constitui um equilíbrio de Nash.

Se dois jogadores Alice e Bob escolhem as estratégias A e B, (a, b) é um equilíbrio de Nash se Alice não tiver outra estratégia disponível que se sai melhor do que A em maximizar sua recompensa em resposta a Bob escolhendo B, e Bob tem Nenhuma outra estratégia disponível que se sai melhor do que B em maximizar sua recompensa em resposta à escolha de Alice A. Em um jogo em que Carol e Dan também são jogadores (A, B, C, D) é um equilíbrio de Nash se A for Alice &# 39; a melhor resposta a (b, c, d), b é a melhor resposta de Bob ' a (a, c, d) e assim por diante.

Nash mostrou que há um equilíbrio de Nash, possivelmente em estratégias mistas, para todos os jogos finitos.

Aplicações

Os teóricos do jogo usam o equilíbrio de Nash para analisar o resultado da interação estratégica de vários tomadores de decisão. Em uma interação estratégica, o resultado para cada tomador de decisão depende das decisões dos outros e também da sua. A insight simples subjacente à idéia de Nash é que não se pode prever as escolhas de vários tomadores de decisão se analisar essas decisões isoladamente. Em vez disso, é preciso perguntar o que cada jogador faria levando em consideração o que o jogador espera que os outros façam. O Equilíbrio de Nash exige que as opções sejam consistentes: nenhum jogador deseja desfazer sua decisão, dado o que os outros estão decidindo.

O conceito foi usado para analisar situações hostis, como o dilema de guerras e armas (consulte o dilema do prisioneiro) e também como o conflito pode ser mitigado pela interação repetida (ver tit-for-tat). Também tem sido usado para estudar até que ponto as pessoas com preferências diferentes podem cooperar (ver Batalha dos Sexos) e se elas correrão riscos para alcançar um resultado cooperativo (ver Stag Hunt). Foi usado para estudar a adoção de padrões técnicos e também a ocorrência de corridas bancárias e crises de moeda (consulte o jogo de coordenação). Outras aplicações incluem fluxo de tráfego (consulte o princípio do Wardrop), como organizar leilões (ver teoria do leilão), o resultado dos esforços exercidos por várias partes no processo educacional, legislação regulatória, como regulamentos ambientais (ver tragédia do Commons ), Gerenciamento de Recursos Naturais, Analisando Estratégias de Marketing, Penalidade Chega no Futebol (consulte Pennies correspondentes), navegação por robôs em multidões, sistemas de energia, sistemas de transporte, problemas de evacuação e comunicações sem fio.

História

O equilíbrio de Nash recebeu o nome do matemático americano John Forbes Nash Jr. A mesma idéia foi usada em uma aplicação específica em 1838 por Antoine Augustin Cournot em sua teoria do oligopólio. Na teoria de Cournot, cada uma das várias empresas escolhem quanta produção produzir para maximizar seu lucro. A melhor saída para uma empresa depende das saídas dos outros. Um equilíbrio de Cournot ocorre quando a saída de cada empresa maximiza seus lucros, dada a saída das outras empresas, que é um equilíbrio de Nash de estratégia pura. Cournot também introduziu o conceito de melhor dinâmica de resposta em sua análise da estabilidade do equilíbrio. Cournot não usou a idéia em nenhum outro aplicativo, no entanto, nem a definiu em geral.

O conceito moderno de equilíbrio de Nash é definido em termos de estratégias mistas, onde os jogadores escolhem uma distribuição de probabilidade sobre possíveis estratégias puras (que podem colocar 100% da probabilidade em uma estratégia pura; essas estratégias puras são um subconjunto de misto estratégias). O conceito de equilíbrio de estratégia misto foi introduzido por John von Neumann e Oskar Morgenstern em seu livro de 1944 A teoria dos jogos e comportamento econômico , mas a análise deles foi restrita ao caso especial de jogos zero de soma . Eles mostraram que um equilíbrio de Nash de estratégia mista existirá para qualquer jogo de soma zero com um conjunto de ações finitas. A contribuição de Nash em seu artigo de 1951-jogos não cooperativos " foi definir um equilíbrio de Nash de estratégia mista para qualquer jogo com um conjunto de ações finitas e provar que pelo menos um (estratégia mista) Nash Equilibrium deve existir nesse jogo. A chave da capacidade de Nash de provar a existência muito mais de maneira mais geral do que Von Neumann estava em sua definição de equilíbrio. De acordo com Nash, um ponto de equilíbrio é uma tupla n, de modo que a estratégia mista de cada jogador maximize [seu] retorno se as estratégias dos outros forem mantidas. Assim, a estratégia de cada jogador é ideal contra os dos outros. " Colocar o problema nessa estrutura permitiu que Nash empregasse o teorema do ponto fixo de Kakutani em seu artigo de 1950 para provar a existência de equilíbrios. Seu artigo de 1951 usou o teorema mais simples de Brouwer, para o mesmo objetivo.

Os teóricos do jogo descobriram que, em algumas circunstâncias, o Nash Equilibrium faz previsões inválidas ou falha em fazer uma previsão única. Eles propuseram muitos conceitos de solução (' refinamentos ' de Nash Equilibria) projetados para descartar equilíbrios de Nash implausíveis. Uma questão particularmente importante é que alguns equilíbrios de Nash podem ser baseados em ameaças que não são credíveis ' Em 1965, Reinhard Selten propôs o equilíbrio perfeito do subgame como um refinamento que elimina os equilíbrios que dependem de ameaças não crédicas. Outras extensões do conceito de equilíbrio de Nash abordaram o que acontece se um jogo for repetido ou o que acontece se um jogo for jogado na ausência de informações completas. No entanto, os refinamentos e extensões subsequentes do equilíbrio de Nash compartilham o principal insight sobre o qual repousa o conceito de Nash: o equilíbrio é um conjunto de estratégias para que a estratégia de cada jogador seja ideal, dadas as escolhas dos outros.

Definição

equilíbrio de Nash

Um perfil de estratégia é um conjunto de estratégias, um para cada jogador. Informalmente, um perfil de estratégia é um equilíbrio de Nash se nenhum jogador puder se sair melhor mudando unilateralmente sua estratégia. Para ver o que isso significa, imagine que cada jogador seja informado das estratégias dos outros. Suponha então que cada jogador se pergunte: "Conhecendo as estratégias dos outros jogadores e tratar as estratégias dos outros jogadores como estabelecidos em pedra, posso me beneficiar alterando minha estratégia? "

Por exemplo, se um jogador preferir - sim ", então esse conjunto de estratégias não é um equilíbrio de Nash. Mas se todo jogador prefere não alternar (ou for indiferente entre a comutação e não), o perfil de estratégia é um equilíbrio de Nash. Assim, cada estratégia em um equilíbrio de Nash é a melhor resposta para os outros jogadores ' Estratégias nesse equilíbrio.

Formalmente, deixe ser o conjunto de todas as estratégias possíveis para o jogador , onde . Vamos. ser um perfil de estratégia, um conjunto que consiste em uma estratégia para cada jogador, onde denota o estratégias de todos os jogadores, exceto . Vamos. ser jogador i's payoff como uma função das estratégias. O perfil de estratégia é um equilíbrio de Nash se

Um jogo pode ter mais de um equilíbrio de Nash. Mesmo que o equilíbrio seja único, pode ser fraco : um jogador pode ser indiferente entre várias estratégias, considerando os outros jogadores ' escolhas. É único e chamado de Equilíbrio de Nash rigoroso se a desigualdade for estrita, portanto, uma estratégia é a melhor resposta única:

O conjunto de estratégia pode ser diferente para diferentes jogadores, e seus elementos podem ser uma variedade de objetos matemáticos. Mais simplesmente, um jogador pode escolher entre duas estratégias, por exemplo. Ou, o conjunto de estratégia pode ser um conjunto finito de estratégias condicionais respondendo a outros jogadores, por exemplo. Ou, pode ser um conjunto infinito, um continuum ou unbounded, por exemplo. tal que é um número real não negativo. As provas existentes de Nash assumem um conjunto de estratégia finito, mas o conceito de equilíbrio de Nash não o exige.

Variantes

equilíbrio puro/misturado

Um jogo pode ter uma estratégia pura ou um equilíbrio de Nash de estratégia mista. Neste último, uma estratégia pura é escolhida estocástica com uma probabilidade fixa.

Equilíbrio restrito/não restrito

Suponha que no equilíbrio de Nash, cada jogador se pergunta: "Conhecendo as estratégias dos outros jogadores e tratando as estratégias dos outros jogadores como ambientado, eu sofreria uma perda ao mudar minha estratégia? "

Se a resposta de todo jogador for é classificada como um equilíbrio de Nash rigoroso.

Se, em vez disso, para algum jogador, existe uma igualdade exata entre a estratégia no equilíbrio de Nash e alguma outra estratégia que fornece exatamente o mesmo pagamento (ou seja, o jogador é indiferente entre a comutação e não), então o equilíbrio é classificado como A < I> FRACO ou Equilíbrio de Nash não estrito .

Equilibria para coligações

O equilíbrio de Nash define estabilidade apenas em termos de desvios individuais do jogador. Nos jogos cooperativos, esse conceito não é convincente o suficiente. O forte equilíbrio de Nash permite desvios por todas as coalizões concebíveis. Formalmente, um forte equilíbrio de Nash é um equilíbrio de Nash, no qual nenhuma coalizão, tomando as ações de seus complementos conforme dada, pode se desviar de uma maneira que beneficie todos os seus membros. No entanto, o forte conceito de Nash às vezes é percebido como também " forte " Nisso, o ambiente permite comunicação privada ilimitada. De fato, o forte equilíbrio de Nash deve ser eficiente em relação ao Pareto. Como resultado desses requisitos, o forte Nash é raro demais para ser útil em muitos ramos da teoria dos jogos. No entanto, em jogos como eleições com muito mais jogadores do que possíveis resultados, pode ser mais comum do que um equilíbrio estável.

Um equilíbrio refinado de Nash conhecido como equilíbrio de Nash à prova de coalizão (CPNE) ocorre quando os jogadores não podem se sair melhor, mesmo que possam se comunicar e fazer com que se auto-reforçam " acordo para desviar. Toda estratégia correlacionada apoiada pela dominância rigorosa iterada e na fronteira de Pareto é uma CPNE. Além disso, é possível que um jogo tenha um equilíbrio de Nash que seja resiliente contra coalizões menos que um tamanho especificado, k. O CPNE está relacionado à teoria do núcleo.

Existência

Teorema de existência de Nash

Nash provou que, se estratégias mistas (onde um jogador escolher probabilidades de usar várias estratégias puras) forem permitidas, todos os jogos com um número finito de jogadores nos quais cada jogador pode escolher entre muitas estratégias puras têm pelo menos um equilíbrio de Nash (NE), que pode ser uma estratégia pura para cada jogador ou pode ser uma distribuição de probabilidade sobre estratégias para cada jogador.

Os

equilíbrios Nash não precisam existir se o conjunto de opções for infinito e não compacto. Por exemplo:

  • Um jogo onde dois jogadores simultaneamente nomeiam um número e o jogador nomeando o número maior ganha não tem um NE, já que o conjunto de escolhas não é compacto porque ele é unbounded.
  • Cada um de dois jogadores escolhe um número real estritamente menos de 5 e o vencedor é quem tem o maior número; nenhum número maior estritamente menos de 5 existe (se o número poderia igual 5, o equilíbrio Nash teria ambos os jogadores escolhendo 5 e amarrando o jogo). Aqui, o conjunto de escolhas não é compacto porque não está fechado.

No entanto, existe um equilíbrio de Nash se o conjunto de opções for compacto com a recompensa de cada jogador nas estratégias de todos os jogadores.

O teorema da existência de Rosen

Rosen estendeu o teorema da existência de Nash de várias maneiras. Ele considera um jogo N-Player, no qual a estratégia de cada jogador i é um vetor s i no espaço euclidiano r mi . .+ M n ; Portanto, uma tupla de estratégia é um vetor em r m . Parte da definição de um jogo é um subconjunto s de r m , de modo que a tupla de estratégia deve estar em s . Isso significa que as ações dos jogadores podem ser potencialmente restringidas com base em ações de outros jogadores. Um caso especial comum do modelo é quando s é um produto cartesiano de conjuntos convexos s 1 , ..., s < Sub> n , de modo que a estratégia do jogador i deve estar em s i . Isso representa o caso de que as ações de cada jogador i são restringidas independentemente de outros jogadores ' ações. Se as seguintes condições mantiverem:

  • T é convexo, fechado e limitado;
  • Cada função de pagamento uEu... é contínuo nas estratégias de todos os jogadores, e côncavo em SEu... para cada valor fixo de S- Não.Eu....

então existe um equilíbrio de Nash. A prova usa o teorema de ponto fixo de Kakutani. Rosen também prova que, sob certas condições técnicas que incluem concavidade estrita, o equilíbrio é único.

O resultado

de Nash se refere ao caso especial em que cada um s I De todos os jogadores são funções bilineares das estratégias.

Racionalidade

O equilíbrio de Nash às vezes pode parecer não racional em uma perspectiva de terceira pessoa. Isso ocorre porque um equilíbrio de Nash não é necessariamente o ideal de Pareto.

O equilíbrio de Nash também pode ter consequências não racionais em jogos seqüenciais porque os jogadores podem ameaçar " com ameaças que eles realmente não realizariam. Para esses jogos, o equilíbrio de Nash Perfect Subgame pode ser mais significativo como uma ferramenta de análise.

Exemplos

Jogo de coordenação

Um jogo de coordenação mostrando pagamentos para o jogador 1 (row) \ jogador 2 (coluna)
Estratégia do Jogador 1 Estratégia do Jogador 2
Jogador 2 adota estratégia A Jogador 2 adota estratégia B
Jogador 1 adota estratégia A
4
4
3
1
Jogador 1 adota estratégia B
1
3
2
2

O jogo de coordenação é um jogo clássico de dois jogadores e duas estratégias, como mostrado no exemplo da matriz de pagamento à direita. Existem dois equilíbrios de estratégia pura (a, a) com pagamento 4 para cada jogador e (b, b) com pagamento 2 para cada um. A combinação (B, B) é um equilíbrio de Nash, porque se um jogador mudar unilateralmente sua estratégia de B para A, o retorno deles cairá de 2 para 1.

The Stag Hunt
Estratégia do Jogador 1 Estratégia do Jogador 2
Escada de caça Caça coelho
Escada de caça
2
2
1
0
Caça coelho
0
1
1
1

Um exemplo famoso de um jogo de coordenação é a caça ao veado. Dois jogadores podem optar por caçar um veado ou um coelho, o veado fornecendo mais carne (4 unidades de utilidade, 2 para cada jogador) do que o coelho (1 unidade de utilidade). A ressalva é que o veado deve ser caçado cooperativamente; portanto, se um jogador tentar caçar o veado, enquanto o outro caça o coelho, o caçador de veados falhará totalmente, por uma recompensa de 0, enquanto o caçador de coelhos terá sucesso, para um Pagão de 1. O jogo tem dois equilíbrios (Stag, Stag) e (Rabbit, Rabbit), porque a estratégia ideal de um jogador depende de sua expectativa do que o outro jogador fará. Se um caçador confia que o outro caçará o veado, deve caçar o veado; No entanto, se eles acharem que o outro caçará o coelho, eles também caçarão o coelho. Este jogo é usado como uma analogia para a cooperação social, uma vez que grande parte do benefício que as pessoas ganham na sociedade depende das pessoas que cooperam e confiam implicitamente para agir de uma maneira correspondente à cooperação.

Dirigindo em uma estrada contra um carro que se aproxima e ter que optar por desviar à esquerda ou desviar à direita da estrada, também é um jogo de coordenação. Por exemplo, com payoffs 10, significando nenhum acidente e 0 significando um acidente, o jogo de coordenação pode ser definido com a seguinte matriz de pagamento:

O jogo de condução
Estratégia do Jogador 1 Estratégia do Jogador 2
Dirigir à esquerda Conduzir à direita
Dirigir à esquerda
10.
10.
0
0
Conduzir à direita
0
0
10.
10.

Nesse caso, existem dois equilíbrios de Nash de estratégia pura, quando ambos optam por dirigir à esquerda ou à direita. Se admitirmos estratégias contraditórias (onde uma estratégia pura é escolhida aleatoriamente, sujeita a alguma probabilidade fixa), existem três equilíbrios de Nash para o mesmo caso: dois que vimos na forma de estratégia pura, onde as probabilidades são (0 %, 100%) para o jogador um (0%, 100%) para o jogador dois; e (100%, 0%) para o jogador um (100%, 0%) para o jogador dois, respectivamente. Adicionamos outro onde as probabilidades para cada jogador são (50%, 50%).

Tráfego de rede

Exemplo de gráfico de rede. Valores nas bordas são o tempo de viagem experimentado por um "carro" viajando por essa borda. é o número de carros que viajam através dessa borda.

Uma aplicação de equilibria Nash está na determinação do fluxo esperado de tráfego em uma rede. Considere o gráfico à direita. Se assumirmos que há "carros" viajando de A para D, qual é a distribuição esperada do tráfego na rede?

Esta situação pode ser modelada como um "jogo", onde cada viajante tem uma escolha de 3 estratégias e onde cada estratégia é uma rota de A para D (um de ABD, ABCDou ACD). O "payoff" de cada estratégia é o tempo de viagem de cada rota. No gráfico à direita, um carro viajando via ABD tempo de viagem de experiências , onde é o número de carros que viajam na borda AB. Assim, os pagamentos para qualquer estratégia dada dependem das escolhas dos outros jogadores, como é habitual. No entanto, o objetivo, neste caso, é minimizar o tempo de viagem, não o maximizar. Equilíbrio ocorrerá quando o tempo em todos os caminhos for exatamente o mesmo. Quando isso acontece, nenhum único motorista tem qualquer incentivo para mudar rotas, uma vez que só pode adicionar ao seu tempo de viagem. Para o gráfico à direita, se, por exemplo, 100 carros estão viajando de A para D, então o equilíbrio ocorrerá quando 25 motoristas viajarem ABD, 50 via ABCD, e 25 via ACD. Cada motorista agora tem um tempo total de viagem de 3.75 (para ver isso, um total de 75 carros tomar o AB borda, e também, 75 carros tomar o CD-ROM borda).

Observe que essa distribuição não é, na verdade, socialmente ideal. Se os 100 carros concordaram que 50 viagens via abd e os outros 50 através de acd , o tempo de viagem para qualquer carro único seria realmente ser 3,5, que é inferior a 3,75. Este também é o equilíbrio de Nash se o caminho entre b e c for removido, o que significa que a adição de outra rota possível pode diminuir a Eficiência do sistema, um fenômeno conhecido como paradoxo de Braess.

Jogo de competição

Um jogo de competição
Estratégia do Jogador 1 Estratégia do Jogador 2
Escolha "0" Escolha "1" Escolha "2" Escolha "3"
Escolha "0" 0, 02, -22, -22, -2
Escolha "1" -2, 21, 13, - Sim.3, - Sim.
Escolha "2" -2, 2- Sim., 32, 24, 0
Escolha "3" -2, 2- Sim., 30, 43, 3

Isso pode ser ilustrado por um jogo de dois jogadores, no qual ambos os jogadores escolhem simultaneamente um número inteiro de 0 a 3 e ambos ganham o menor dos dois números em pontos. Além disso, se um jogador escolher um número maior que o outro, terá que desistir de dois pontos para o outro.

Este jogo tem um equilíbrio exclusivo de Nash de estratégia pura: os dois jogadores escolhendo 0 (destacados em vermelho claro). Qualquer outra estratégia pode ser aprimorada por um jogador alternando seu número para um menos que o do outro jogador. Na tabela adjacente, se o jogo começar na Praça Verde, é do interesse do jogador 1 de se mudar para a praça roxa e é do interesse do jogador 2 de se mudar para a praça azul. Embora não se encaixasse na definição de um jogo de competição, se o jogo for modificado para que os dois jogadores ganhem o valor nomeado se ambos escolherem o mesmo número e, de outra forma, não ganharem nada, então existem 4 Equilibria de Nash: (0,0 ), (1,1), (2,2) e (3,3).

Nash equilibria em uma matriz de pagamento

Existe uma maneira numérica fácil de identificar os equilíbrios de Nash em uma matriz de pagamento. É especialmente útil em jogos de duas pessoas, onde os jogadores têm mais de duas estratégias. Nesse caso, a análise formal pode se tornar muito longa. Esta regra não se aplica ao caso em que as estratégias mistas (estocásticas) são de interesse. A regra é da seguinte representa um equilíbrio de Nash.

Uma matriz de pagamento – Nash equilibria em negrito
Estratégia do Jogador 1 Estratégia do Jogador 2
Opção A Opção B Opção C
Opção A 0, 0 25, 405, 10
Opção B 40, 250, 0 5, 15
Opção C 10, 5 15, 5 10, 10

Podemos aplicar esta regra a uma matriz 3 × 3:

Usando a regra, podemos muito rapidamente (muito mais rápido do que com análise formal) ver que as células de equilíbrio de Nash são (B, A), (a, B) e (C, C). De fato, para a célula (B, A), 40 é o máximo da primeira coluna e 25 é o máximo da segunda linha. Para (a, b), 25 é o máximo da segunda coluna e 40 é o máximo da primeira linha; O mesmo se aplica à célula (C, C). Para outras células, um ou ambos os membros do Duplo não são o máximo das linhas e colunas correspondentes.

Dito isto, a mecânica real de encontrar células de equilíbrio é óbvia: encontre o máximo de uma coluna e verifique se o segundo membro do par é o máximo da linha. Se essas condições forem atendidas, a célula representa um equilíbrio de Nash. Verifique todas as colunas dessa maneira para encontrar todas as células NE. Uma matriz n × n pode ter entre 0 e n × n equilíbrios NASH de estratégia pura.

Estabilidade

O conceito de estabilidade, útil na análise de muitos tipos de equilíbrios, também pode ser aplicado aos equilíbrios de Nash.

Um equilíbrio de Nash para um jogo de estratégia mista é estável se uma pequena mudança (especificamente, uma mudança infinitesimal) nas probabilidades de um jogador levar a uma situação em que duas condições mantêm:

  1. o jogador que não mudou não tem melhor estratégia na nova circunstância
  2. o jogador que mudou agora está jogando com uma estratégia estritamente pior.

Se esses casos forem atendidos, um jogador com a pequena mudança em sua estratégia mista retornará imediatamente ao equilíbrio de Nash. Diz -se que o equilíbrio é estável. Se a condição não se mantém, o equilíbrio será instável. Se apenas condicionar que se mantém, provavelmente haverá um número infinito de estratégias ideais para o jogador que mudou.

no jogo de direção " Exemplo acima, existem equilíbrios estáveis e instáveis. Os equilíbrios envolvendo estratégias mistas com 100% de probabilidades são estáveis. Se um dos jogadores mudarem um pouco suas probabilidades, elas estarão em desvantagem, e seu oponente não terá motivos para mudar sua estratégia por sua vez. O equilíbrio (50%, 50%) é instável. Se um dos jogadores mudar suas probabilidades (o que não beneficiaria ou danificariam a expectativa do jogador que fez a mudança, se a estratégia mista do outro jogador ainda for (50%, 50%)), o outro jogador imediatamente o fez Uma estratégia melhor em (0%, 100%) ou (100%, 0%).

A estabilidade é crucial em aplicações práticas do Equilíbrios de Nash, uma vez que a estratégia mista de cada jogador não é perfeitamente conhecida, mas deve ser inferida a partir da distribuição estatística de suas ações no jogo. Nesse caso, é improvável que os equilíbrios instáveis surjam na prática, uma vez que qualquer minuto alteração nas proporções de cada estratégia observada levará a uma mudança na estratégia e à quebra do equilíbrio.

Finalmente, nos anos 80, construindo com grande profundidade em tais idéias, os equilíbrios estáveis para Mertens foram introduzidos como um conceito de solução. Os equilíbrios estáveis de Mertens satisfazem a indução para a frente e a indução para trás. Em um contexto de teoria dos jogos, os equilíbrios estáveis agora geralmente se referem a equilíbrios estáveis de Mertens.

Ocorrência

Se um jogo tiver um equilíbrio exclusivo de Nash e for jogado entre os jogadores sob determinadas condições, o conjunto de estratégia NE será adotado. Condições suficientes para garantir que o equilíbrio de Nash seja reproduzido são:

  1. Todos os jogadores farão o máximo para maximizar seu pagamento esperado, conforme descrito pelo jogo.
  2. Os jogadores são impecáveis na execução.
  3. Os jogadores têm inteligência suficiente para deduzir a solução.
  4. Os jogadores conhecem a estratégia de equilíbrio planejada de todos os outros jogadores.
  5. Os jogadores acreditam que um desvio em sua própria estratégia não causará desvios por outros jogadores.
  6. Há conhecimento comum de que todos os jogadores cumprem essas condições, incluindo esta. Então, não só cada jogador deve saber que os outros jogadores cumprem as condições, mas também eles devem saber que todos eles sabem que eles os encontram, e sabem que eles sabem que eles conhecem e assim por diante.

Quando as condições não forem cumpridas

Exemplos de problemas da teoria dos jogos nos quais essas condições não são atendidas:

  1. A primeira condição não é satisfeita se o jogo não descrever corretamente as quantidades que um jogador deseja maximizar. Neste caso, não há nenhuma razão particular para que o jogador adote uma estratégia de equilíbrio. Por exemplo, o dilema do prisioneiro não é um dilema se qualquer jogador está feliz por ser preso indefinidamente.
  2. imperfeição intencional ou acidental na execução. Por exemplo, um computador capaz de jogo lógico impecável enfrentando um segundo computador impecável resultará em equilíbrio. A introdução da imperfeição levará à sua ruptura, seja através da perda para o jogador que comete o erro, ou através da negação do critério de conhecimento comum levando à possível vitória para o jogador. (Um exemplo seria um jogador de repente colocando o carro em reverso no jogo de frango, garantindo um cenário sem perder nenhum-ganho).
  3. Em muitos casos, a terceira condição não é satisfeita porque, embora o equilíbrio deve existir, é desconhecido devido à complexidade do jogo, por exemplo no xadrez chinês. Ou, se conhecido, pode não ser conhecido por todos os jogadores, como ao jogar tic-tac-toe com uma criança pequena que desesperadamente quer ganhar (metendo os outros critérios).
  4. O critério do conhecimento comum pode não ser cumprido mesmo que todos os jogadores, de fato, atendam a todos os outros critérios. Os jogadores erroneamente desconfiando da racionalidade uns dos outros podem adotar contra-estratégias para o jogo irracional esperado em nome de seus oponentes. Esta é uma grande consideração em "frango" ou uma corrida de armas, por exemplo.

Quando as condições são cumpridas

em seu Ph.D. Dissertação, John Nash propôs duas interpretações de seu conceito de equilíbrio, com o objetivo de mostrar como os pontos de equilíbrio podem ser conectados ao fenômeno observável.

(...) Uma interpretação é racionalista: se assumirmos que os jogadores são racionais, conhecer a estrutura completa do jogo, o jogo é jogado apenas uma vez, e há apenas um equilíbrio Nash, então os jogadores vão jogar de acordo com esse equilíbrio.

Essa idéia foi formalizada por R. Aumann e A. Brandenburger, 1995, Condições epistêmicas para Nash Equilibrium , Econometrica, 63, 1161-1180 que interpretaram a estratégia mista de cada jogador; Conjectura sobre o comportamento de outros jogadores e demonstraram que, se o jogo e a racionalidade dos jogadores são conhecidos mutuamente e essas conjecturas forem conhecidas, as conjecturas devem ser um equilíbrio de Nash (uma suposição anterior comum é necessária para esse resultado em geral, Mas não no caso de dois jogadores.

Uma segunda interpretação, que Nash referida pela interpretação da ação em massa, é menos exigente para os jogadores:

[i]t é desnecessário assumir que os participantes têm pleno conhecimento da estrutura total do jogo, ou a capacidade e inclinação para passar por qualquer processo de raciocínio complexo. O que é assumido é que há uma população de participantes para cada posição no jogo, que será jogado ao longo do tempo pelos participantes sorteados aleatoriamente das diferentes populações. Se houver uma frequência média estável com a qual cada estratégia pura é empregada por Membro médio da população adequada, então esta frequência média estável constitui uma estratégia mista equilíbrio de Nash.

Para um resultado formal nesse sentido, consulte Kuhn, H. e et al., 1996, " O trabalho de John Nash na teoria dos jogos ", Journal of Economic Theory , 69, 153-185.

Devido às condições limitadas em que o NE pode realmente ser observado, elas raramente são tratadas como um guia para o comportamento do dia-a-dia ou observadas na prática nas negociações humanas. No entanto, como um conceito teórico em economia e biologia evolutiva, o NE tem poder explicativo. A recompensa na economia é a utilidade (ou às vezes dinheiro), e na biologia evolutiva é a transmissão de genes; Ambos são os fundamentos fundamentais de sobrevivência. Os pesquisadores que aplicam a teoria dos jogos nesses campos afirmam que as estratégias que não conseguem maximizá -las por qualquer motivo serão competidas fora do mercado ou ambiente, que são atribuídas a capacidade de testar todas as estratégias. Esta conclusão é tirada da estabilidade " teoria acima. Nessas situações, a suposição de que a estratégia observada é na verdade uma NE muitas vezes foi confirmada por pesquisas.

NE e ameaças não credíveis

Ilustrações de forma extensas e normais que mostram a diferença entre SPNE e outros NE. O equilíbrio azul não é perfeito porque o jogador dois faz uma ameaça não credível em 2(2) para ser indelicado (U).

O equilíbrio de Nash é um superconjunto do equilíbrio de Nash Perfect Subgame. O equilíbrio perfeito do subgame, além do equilíbrio de Nash, exige que a estratégia também seja um equilíbrio de Nash em todos os sub -jogos desse jogo. Isso elimina todas as ameaças não crédicas, ou seja, estratégias que contêm movimentos não racionais, a fim de fazer com que o contra-jogador mude sua estratégia.

A imagem à direita mostra um jogo seqüencial simples que ilustra o problema com os equilíbrios de Nash imperfeitos do subgame. Neste jogo, o jogador um escolhe esquerda (L) ou direita (R), que é seguido pelo jogador dois sendo chamado a ser gentil (k) ou cruel (U) para o jogador um, no entanto, o jogador dois só ganha por ser Desarranjo se o jogador um for para a esquerda. Se o jogador um for certo, o jogador racional dois seria gentil com ela nesse sub -jogo. No entanto, a ameaça não crédulo de ser cruel em 2 (2) ainda faz parte do equilíbrio azul (L, (U, U)). Portanto, se o comportamento racional puder ser esperado por ambas as partes, o equilíbrio perfeito de Nash no subgame pode ser um conceito de solução mais significativo quando essas inconsistências dinâmicas surgirem.

Prova de existência

Prova usando o teorema de ponto fixo Kakutani

A prova original (em sua tese) de Nash usou o teorema do ponto fixo de Brouwer (por exemplo, veja abaixo uma variante). Esta seção apresenta uma prova mais simples através do teorema do ponto fixo de Kakutani, seguindo o artigo de Nash de 1950 (ele credita David Gale com a observação de que essa simplificação é possível).

Para provar a existência de um equilíbrio de Nash, deixe ser a melhor resposta do jogador i para as estratégias de todos os outros jogadores.

Toma. , onde , é um perfil de estratégia mista no conjunto de todas as estratégias mistas e é a função de pagamento para o jogador i. Defina uma função de valor definido tal que . A existência de um equilíbrio de Nash é equivalente a ter um ponto fixo.

O teorema de ponto fixo de Kakutani garante a existência de um ponto fixo se as quatro condições a seguir forem satisfeitas.

  1. é compacto, convexo, e nenhummpty.
  2. Não é nada.
  3. é superior hemicontinuous
  4. É convexo.

Condição 1. está satisfeito com o fato de que é um simples e, portanto, compacto. Convexidade segue da capacidade dos jogadores de misturar estratégias. não é nenhummpty enquanto os jogadores têm estratégias.

A condição 2. e 3. estão satisfeitos por meio do teorema máximo de Berge. Porque... é contínuo e compacto, é não vazio e hemicontinuous superior.

Condição 4. está satisfeito como resultado de estratégias mistas. Suponha , então . ou seja, se duas estratégias maximizar os pagamentos, então uma mistura entre as duas estratégias irá render o mesmo pagamento.

Portanto, existe um ponto fixo em e um equilíbrio de Nash.

Quando Nash fez esse ponto para John von Neumann em 1949, Von Neumann o descartou com as palavras, isso é trivial, você sabe. Isso é apenas um teorema de ponto fixo. " (Ver Nasar, 1998, p. 94.)

Prova alternativa usando o teorema de ponto fixo Brouwer

Temos um jogo. Onde? é o número de jogadores e é o jogo de ação para os jogadores. Todos os conjuntos de ação são finitas. Vamos. denota o conjunto de estratégias mistas para os jogadores. A finitude do s garante a compactação de .

Agora podemos definir as funções de ganho. Para uma estratégia mista , deixamos o ganho para o jogador sobre a acção ser

A função de ganho representa o benefício que um jogador recebe alterando unilateralmente sua estratégia. Definimos agora Onde?

para . Nós vemos que

Em seguida, definimos:

É fácil ver que cada um é uma estratégia mista válida em . Também é fácil verificar se cada um é uma função contínua de e daí é uma função contínua. Como produto transversal de um número finito de conjuntos de convexos compactos, também é compacto e convexo. Aplicando o teorema de ponto fixo Brouwer para e nós concluímos que tem um ponto fixo em Chama-o. . Nós reivindicamos que é um equilíbrio de Nash em . Com esta finalidade, basta mostrar que

Isso simplesmente afirma que cada jogador não ganha benefícios alterando unilateralmente sua estratégia, o que é exatamente a condição necessária para um equilíbrio de Nash.

Agora assuma que os ganhos não são todos zero. Portanto, e tal que . Então...

Então vamos

Também denotaremos como o vetor de ganho indexado por ações em . Desde então. é o ponto fixo que temos:

Desde então. nós temos é algum escalonamento positivo do vetor . Agora dizemos que

Para ver isto, primeiro se então isso é verdade por definição da função de ganho. Agora assuma isso. . Por nossas declarações anteriores temos que

e assim o termo esquerdo é zero, dando-nos que toda a expressão é como necessário.

Então, finalmente temos isso

onde a última desigualdade segue desde é um vetor não-zero. Mas esta é uma clara contradição, então todos os ganhos devem ser de fato zero. Portanto, é um equilíbrio de Nash para como necessário.

Computação Nash equilibria

Se um jogador A tem uma estratégia dominante então existe um equilíbrio de Nash no qual A joga . No caso de dois jogadores A e B, existe um equilíbrio de Nash no qual A joga e B desempenha uma melhor resposta . Se é uma estratégia estritamente dominante, A joga em todos os equilíbrios de Nash. Se ambos A e B têm estratégias estritamente dominantes, existe um equilíbrio Nash único no qual cada um desempenha sua estratégia estritamente dominante.

Em jogos com os equilíbrios de Nash de estratégia mista, a probabilidade de um jogador escolher qualquer estratégia (tão pura) pode ser calculada atribuindo uma variável a cada estratégia que represente uma probabilidade fixa para escolher essa estratégia. Para que um jogador esteja disposto a randomizar, seu retorno esperado para cada estratégia (pura) deve ser a mesma. Além disso, a soma das probabilidades para cada estratégia de um determinado jogador deve ser 1. Isso cria um sistema de equações a partir da qual as probabilidades de escolher cada estratégia podem ser derivadas.

Exemplos

Combinando centavos
Estratégia Jogador B joga H Jogador B joga T
Jogador A joga H -1, +1 +1, -1
Jogador A joga T +1, -1 -1, +1

No jogo de moedas correspondentes, o jogador A perde um ponto para B se A e B jogar a mesma estratégia e ganha um ponto de B se eles jogam diferentes estratégias. Para calcular o equilíbrio de Nash de estratégia mista, atribuir A a probabilidade de jogar H e de jogar T, e atribuir B a probabilidade de jogar H e de jogar T.

Assim, um equilíbrio de Nash de estratégia mista neste jogo é para cada jogador escolher aleatoriamente H ou T com e .

Oddness dos pontos de equilíbrio

Jogo de Dinheiro Livre
Estratégia Jogador B votos Sim. Jogador B votos Não
Jogador Um voto Sim 1, 1 0, 0
Jogador Um voto Não 0, 0 0, 0

Em 1971, Robert Wilson criou o teorema da estranheza, que diz que "quase todos" 34; Jogos finitos têm um número finito e ímpar de equilíbrio de Nash. Em 1993, Harsanyi publicou uma prova alternativa do resultado. " quase todos " Aqui significa que qualquer jogo com um número infinito ou uniforme de equilíbrios é muito especial no sentido de que, se seus recompensas fossem um pouco perturbados aleatoriamente, com probabilidade de um, teria um número ímpar de equilíbrios.

O dilema do prisioneiro, por exemplo, tem um equilíbrio, enquanto a batalha dos sexos tem três - dois puros e um misturado, e isso permanece verdadeiro mesmo que os pagamentos mudem um pouco. O jogo de dinheiro gratuito é um exemplo de A " especial " Jogo com um número uniforme de equilíbrio. Nele, dois jogadores precisam votar "sim"; em vez de " no " Para obter uma recompensa e os votos são simultâneos. Existem dois equilíbrios de Nash de estratégia pura, (sim, sim) e (não, não), e nenhum equilíbrio de estratégia mista, porque a estratégia "sim"; domina fracamente " no ". " sim " é tão bom quanto " no " Independentemente da ação do outro jogador, mas se houver alguma chance, o outro jogador escolhe "sim"; Então, sim, sim " é a melhor resposta. Sob uma pequena perturbação aleatória dos pagamentos, no entanto, a probabilidade de que dois pagamentos permanecessem amarrados, seja em 0 ou algum outro número, é muito pequeno, e o jogo teria um ou três equilíbrios.

Nash-solvability em estratégias puras e dualidade booleana

Vamos. e ser um par de multi-hipergramas duplos no conjunto de terra comum . Note que ou pode ter bordas embutidas ou iguais.

Uma borda é mínima se não for um superconjunto rigoroso de outra borda. No entanto, as bordas mínimas iguais podem existir.

Um par é chamado se para cada par e .

Um conjunto é chamado para se para todos .

Por definição, cada é transversal a .

Nós dizemos que é duplo para se e cada transversal a contém uma borda .

Da mesma forma, definimos transversais para e quando é duplo para .

É óbvio e bem conhecido que é duplo para se e somente se é duplo para . Neste caso multi-hipergrafias e são chamados .

Dualidade de e implica por definição. Obviamente, também implica

Para cada mínimo e cada existe uma borda (minimal) tal que .

De facto, caso contrário não seria mínimo em .

Reivindicação pode ser estendido da seguinte forma. Uma ordem linear sobre define uma ordem lexicográfico única sobre o Boolean . Vamos. ser a borda lexicograficamente máxima de . Então,

é mínimo em e para cada existe um (minimal) tal que e para cada .

Esta propriedade possui aplicações imediatas na teoria dos jogos, implicando a solvabilidade de Nash de formas e correspondências de jogo apertadas. Primeiro, foi demonstrado por V. Gurvich in.

No caso de soma zero, este resultado foi obtido anteriormente por J. Edmonds e D.R. Fulkerson.

Deixe as estratégias de Alice e Bob ser as bordas de multi-hipergramas e , respectivamente. Cada par de bordas com , define o conjunto de resultados . Assim, par define uma correspondência de jogo . Além disso, escolher um (arbitrário) resultado de cada interseção resulta em uma forma de jogo .

Uma forma de jogo é chamado se suas multi-hipergrafias e são duplos.

Uma forma de jogo é chamado se por quaisquer pagamentos e de Alice e Bob o jogo obtido tem pelo menos um NE (em estratégias puras).

Uma forma de jogo é Nash-solvable se e somente se for apertado.

Observe que esse resultado é mantido apenas para o caso de duas pessoas. Para 3 jogadores, o aperto se torna não necessário nem suficiente para a solvabilidade de Nash; Veja exemplos em.

Além disso, a estratégia NE de Alice é sua estratégia lexmax. Curiosamente, não depende da preferência de Bob. A Alice pode não estar ciente disso. Dada essa estratégia, Bob maximiza seu pagamento. Por favor. , ele tem uma estratégia percebendo um Equilíbrio de Nash.

É claro, trocando Alice e Bob também obtemos um equilíbrio de Nash. Esses dois tipos de NE podem coincidir. Acontece, por exemplo, no caso de soma zero ou se existe um NE exclusivo.

No entanto, se tanto Alice quanto Bob aplicarem suas estratégias lexmax, o par obtido pode não ser um NE; veja um exemplo em.

Bordas e satisfazendo e o NE correspondente pode ser encontrado em tempo polinomial. Isto é trivial se ambos os multi-hipergramas duplos e são dados explicitamente. No entanto, é verdade se apenas um deles é dado, e não explicitamente, mas por um oráculo polinomial cujo tamanho pode ser logarítmica no tamanho de e . V. Gurvich e M. Naumova forneceram quatro exemplos de tais oráculos polinomiais.

Ver também

  • Procedimento de vencedor ajustado – Método de divisão justa da propriedade
  • Teoria da complementaridade – tipo de problema de otimização matemática
  • Resolução de conflitos – Métodos e processos envolvidos na facilitação do fim pacífico do conflito e da retribuição
  • Cooperação – Grupos trabalhando ou atuando juntos
  • Seleção de equilíbrio
  • Estratégia evolutivamente estável – Conceito de solução na teoria dos jogos
  • Glossário da teoria do jogo – Lista de definições de termos e conceitos usados na teoria do jogo
  • Lei de Hotelling – Observação na economia
  • Manipulação do equilíbrio de Nash
  • Impasse mexicano – Tipo de confronto
  • Minimax teorema – Dá condições que garantem a desigualdade máxima-min também é uma igualdade
  • Destruição mútua garantida – Doutrina da estratégia militar
  • Programação Matemática Estendida para Problemas de Equilíbrio
  • Contrato ótimo e contrato par – Termos de pontuação da ponte na ponte do contrato do jogo do cartão
  • Equilíbrio autoconfirmante
  • Conceito de solução – Regra formal para prever como um jogo será jogado
  • Competição Stackelberg – Modelo econômico
  • Princípio de Wardrop – Maior teórico do equilíbrio do fluxo de tráfego

Notas

  1. ^ Este termo é despreferido, pois também pode significar o oposto de um equilíbrio de Nash "forte" (isto é, um equilíbrio de Nash que é vulnerável à manipulação por grupos).

Referências

  1. ^ Osborne, Martin J.; Rubinstein, Ariel (12 de julho de 1994). Um curso em teoria do jogo. Cambridge, MA: MIT. p. 14. ISBN 9780262150415.
  2. ^ Kreps D.M. (1987) "Nash Equilibrium". Em: Palgrave Macmillan (eds) O Novo Dicionário Palgrave de Economia. Palgrave Macmillan, Londres.
  3. ^ Nash, John F. (1950). «Equilibrium points in n-person games» (em inglês). PNAS. 36 (1): 48–49. Bibcode:1950PNAS...36...48N. doi:10.1073/pnas.36.1.48. PMC 1063129. PMID 16588946.
  4. ^ Schelling, Thomas, A Estratégia de Conflito, copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3.
  5. ^ De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). «Must Try Harder: Evaluating the Role of Effort in Educational Attainment» (em inglês). Revisão de Economia e Estatística. 92 (3): 577. doi:10.1162/REST_a_00013. Hdl:21 de Dezembro de 2000. S2CID 57072280.
  6. ^ Ward, H. (1996). «Game Theory and the Politics of Global Warming: The State of Play and Beyond» (em inglês). Estudos políticos. 44 (5): 850–871. doi:10.1111/j.1467-9248.1996.tb00338.x. S2CID 143728467.,
  7. ^ Thorpe, Robert B.; Jennings, Simon; Dolder, Paul J. (2017). «Risks and benefits of catching pretty good income in multispecies mixed fishing» (em inglês). ICES Journal of Marine Science. 74 (8): 2097–2106.10.1093/icesjms/fsx062.,
  8. ^ «Marketing Lessons from Dr. Nash - Andrew Frank» (em inglês). 2015-05-25. Retrieved 2015-08-30.
  9. ^ Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer" (PDF). Revisão econômica americana. 92 (4): 1138. CiteSeerX 10.1.1.178.1646. doi:10.1257/000280260344678.
  10. ^ Muchen Sun; Francesca Baldini; Katie Hughes; Peter Trautman; Todd Murphey (2024). «Mixed-Strategy Nash Equilibrium for Crowd Navigation» (em inglês). - Sim.2403.01537 [cs.RO]
  11. ^ Djehiche, B.; Tcheukam, A.; Tembine, H. (2017). «A Mean-Field Game of Evacuation in Multilevel Building» (em inglês). Transações IEEE no Controle Automático. 62 (10): 5154–5169. doi:10.1109/TAC.2017.2679487. ISSN 0018-9286. S2CID 21850096.
  12. ^ Djehiche, Boualem; Tcheukam, Alain; Tembine, Hamidou (2017-09-27). «Mean-Field-Type Games in Engineering» (em inglês). AIMS Eletrônica e Engenharia Elétrica. 1: 18–73.1605.03281. doi:10.3934/ElectrEng.2017.1.18. S2CID 16055840.
  13. ^ Cournot A. (1838) Pesquisas sobre os Princípios Matemáticas da Teoria da Wealth
  14. ^ J. Von Neumann, O. Morgenstern, Teoria dos Jogos e Comportamento Econômico, copyright 1944, 1953, Princeton University Press
  15. ^ Carmona, Guilherme; Podczeck, Konrad (2009). "On the Existence of Pure Strategy Nash Equilibria in Large Games" (PDF). Jornal Oficial das Comunidades Europeias Teoria. 144 (3): 1300–1319. doi:10.1016/j.jet.2008.11.009. Hdl:10362/11777. SSRN 882466.
  16. ↑ a b von Ahn, Luis. "Preliminares da Teoria do Jogo" (PDF). Ciência da Web. Arquivado do original (PDF) em 2011-10-18. Retrieved 2008-11-07.
  17. ^ «Nash Equilibria» (em inglês). hoylab.cornell.edu. Arquivado do original em 16 de junho de 2019. Retrieved 2019-12-08.
  18. ↑ a b B. D. Bernheim; B. Peleg; M. D. Whinston (1987), "Coalition-Proof Equilibria I. Concepts", Jornal Oficial das Comunidades Europeias Teoria, 42 (1): 1-12, doi:10.1016/0022-0531(87)90099-8.
  19. ^ Aumann, R. (1959). «Acceptable points in general cooperativa n-person games» (em inglês). Contribuições para a Teoria dos Jogos. Vol. IV. Princeton, N.J.: Princeton University Press. ISBN 978-1-4008-8216-8.
  20. ^ D. Moreno; J. Wooders (1996), "Coalition-Proof Equilibrium" (PDF), Jogos e Comportamento Econômico, 17. (1): 80–112, doi:10.1006/game.1996.0095, hdl:10016/4408.
  21. ^ MIT OpenCourse Ware. 6.254: Teoria do Jogo com Aplicações de Engenharia, Primavera de 2010. Palestra 6: Jogos Contínuos e Descontinuos.
  22. ^ Rosen, J. B. (1965). «Existence and Uniqueness of Equilibrium Points for Concave N-Person Games» (em inglês). Econometria. 33 (3): 520-534. doi:10.2307/1911749. Hdl:2060/19650010164ISSN 0012-9682. JSTOR 1911749.
  23. ^ T. L. Turocy, B. Von Stengel, Teoria do jogo, copyright 2001, Texas A&M University, London School of Economics, páginas 141-144. Nash provou que uma NE perfeita existe para este tipo de jogo de forma extensiva finita – pode ser representado como uma estratégia em conformidade com suas condições originais para um jogo com um NE. Tais jogos podem não ter NE único, mas pelo menos uma das muitas estratégias de equilíbrio seria jogado por jogadores hipotéticos tendo conhecimento perfeito de todos 10.150. árvores de jogo.
  24. ^ J. C. Cox, M. Walker, Aprendendo a Jogar Cournot Duoploy Estratégias Arquivado em 2013-12-11 no Wayback Machine, copyright 1997, Texas A&M University, University of Arizona, páginas 141-144
  25. ^ Fudenburg, Drew; Tirole, Jean (1991). Teoria do jogo. MIT Imprensa. ISBN 978-0-262-06141-4.
  26. ^ Wilson, Robert (1971-07-01). «Computing Equilibria of N-Person Games» (em inglês). SIAM Journal on Matemática Aplicada. 21 (1): 80–87. doi:10.1137/0121011. ISSN 0036-1399.
  27. ^ Harsanyi, J. C. (1973-12-01). «Oddness of the Number of Equilibrium Points: A New Proof» (em inglês). International Journal of Game Theory. 2 (1): 235–250. doi:10.1007/BF01737572. ISSN 1432-1270. S2CID 122603890.
  28. ↑ a b c Gurvich, Vladimir (1975). «Solução de jogos posicionais em estratégias puras». Computação da URSS. Matemática e Matemática. Phys. 15. (2): 74–87.
  29. ↑ a b c >Gurvich, Vladimir (1989). «Equilíbrio em estratégias puras». Matemática Soviética. Dokl. 38 (3): 597–602.
  30. ^ Edmonds, Jack; Fulkerson, Delbert Ray (1970). "Bottleneck extrema". J. de Teoria Combinatória. 8: 299–306.
  31. ↑ a b Gurvich, Vladimir; Naumova, Mariya (2024). «Lexicographically maximal edges of dual hypergraphs and Nash-solvability of tight game forms» (em inglês). Anais de Matemática e Inteligência Artificial. 92 (1): 49–57.
  32. ↑ a b c Gurvich, Vladimir; Naumova, Mariya (2023). «Computing lexicographically safe Nash equilibria in finito two-person games with tight game forms given by oracles» (em inglês). Matemática Aplicada Discreta. 340: 53–68.

Bibliografia

Teoria dos jogos manuais

  • Binmore, Ken (2007), Jogar por Real: Um texto na teoria do jogo, Oxford University Press, ISBN 978-0195300574.
  • Dixit, Avinash, Susan Skeath e David Reiley. Jogos de Estratégia. W.W. Norton & Company. (Terceira edição em 2009.) Um texto de graduação.
  • Dutta, Prajit K. (1999), Estratégias e jogos: teoria e prática, MIT Imprensa, ISBN 978-0-262-04169-0. Adequado para estudantes de graduação e negócios.
  • Fudenberg, Drew e Jean Tirole (1991) Teoria do jogo MIT Imprensa.
  • Gibbons, Robert (1992), Teoria do jogo para Economistas Aplicados, Princeton University Press (13 de julho de 1992), ISBN 978-0-691-00395-5. introdução lúcida e detalhada à teoria do jogo em um contexto explicitamente econômico.
  • Morgenstern, Oskar e John von Neumann (1947) Teoria dos Jogos e Comportamento Econômico Princeton University Press.
  • Myerson, Roger B. (1997), Teoria do jogo: Análise do Conflito, Harvard University Press, ISBN 978-0-674-34116-6
  • Osborne, Martin (2004), Uma introdução à teoria do jogo, Oxford University Press, ISBN 978-0-19-512895-6.
  • Papayoanou, Paul (2010), Teoria do Jogo para Negócios: Um Primer em Jogos Estratégicos, Probabilistic Publishing, ISBN 978-0964793873
  • Rubinstein, Ariel; Osborne, Martin J. (1994), Um curso em teoria do jogo, MIT Press, ISBN 978-0-262-65040-3. Uma introdução moderna no nível de pós-graduação.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algoritmic, Game-Theoretic, and Logical Foundations, New York: Cambridge University Press, ISBN 978-0-521-89943-7. Uma referência abrangente de uma perspectiva computacional; ver Capítulo 3. Downloadable grátis online.

Original Nash papers

  • Nash, John (1950) «Equilibrium points in n-person games» Procedimentos da Academia Nacional de Ciências 36(1):48-49.
  • Nash, John (1951) "Non-Cooperative Games" Os Anéis da Matemática 54(2):286-295.

Outras referências

  • Mehlmann, A. (2000) O Afoot do Jogo! Teoria do jogo em Myth e Paradox, American Mathematical Society.
  • Nasar, Sylvia (1998), Uma mente bonitaSimon & Schuster.
  • Aviad Rubinstein: "Hardness of Approximation Between P and NP", ACM, ISBN 978-1-947487-23-9 (maio de 2019), DOI: https://doi.org/10.1145/3241304. Explica o Equilíbrio Nash é um problema difícil na computação.
  • "Nash theorem (em teoria do jogo)", Enciclopédia da Matemática, EMS Press, 2001 [1994]
  • Prova completa da existência de Nash Equilibria
  • Formulário simplificado e resultados relacionados Arquivado 2021-07-31 no Wayback Machine

Contenido relacionado

Kristen nygaard

Kristen Nygaard fue una científica informática noruega, pionera del lenguaje de programación y política. A nivel internacional, Nygaard es reconocido como...

Esclavitud asalariada

Esclavitud asalariada o salario de esclavos se refiere a la dependencia de una persona de los salarios para su sustento, especialmente cuando los salarios son...

Transformada rápida de Fourier

A rápido Fourier transformado es un algoritmo que computa la transformación discreta Fourier de una secuencia, o su inverso a una representación en el...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save