Qual é o dilema dos prisioneiros?

No próprio jogo, as punições (e recompensas, quando relevantes) são representadas por Utilitário números. Números positivos representam bons resultados, números negativos representam resultados ruins e um resultado é melhor que outro se o número associado a ele for maior. (No entanto, tenha cuidado com o modo como isso funciona para números negativos, pois -5, por exemplo, é maior que -20!)

Na tabela acima, o primeiro número em cada caixa refere-se ao resultado do jogador 1 e o segundo número representa o resultado do jogador 2. Esses números representam apenas um dos muitos conjuntos de números que são consistentes com a configuração do dilema dos prisioneiros.

Depois que um jogo é definido, o próximo passo na análise do jogo é avaliar as estratégias dos jogadores e tentar entender como os jogadores provavelmente se comportam. Os economistas fazem algumas suposições quando analisam os jogos - primeiro, eles assumem que os dois jogadores estão cientes de as recompensas para si e para o outro jogador, e, segundo, eles assumem que os dois jogadores estão procurando para

instagram viewer
racionalmente maximizar sua própria recompensa do jogo.

Uma abordagem inicial fácil é procurar o que é chamado estratégias dominantes- estratégias melhores, independentemente da estratégia escolhida pelo outro jogador. No exemplo acima, optar por confessar é uma estratégia dominante para ambos os jogadores:

Dado que confessar é melhor para ambos os jogadores, não é de surpreender que o resultado em que ambos os jogadores confessem seja um resultado de equilíbrio do jogo. Dito isto, é importante ser um pouco mais preciso com nossa definição.

O conceito de Equilíbrio de Nash foi codificado pelo matemático e teórico dos jogos John Nash. Simplificando, um Nash Equilibrium é um conjunto de estratégias de melhor resposta. Para um jogo para dois jogadores, um equilíbrio de Nash é um resultado em que a estratégia do jogador 2 é a melhor resposta à estratégia do jogador 1 e a estratégia do jogador 1 é a melhor resposta à estratégia do jogador 2.

Encontrar o equilíbrio de Nash através deste princípio pode ser ilustrado na tabela de resultados. Neste exemplo, as melhores respostas do jogador 2 ao jogador um são circuladas em verde. Se o jogador 1 confessar, a melhor resposta do jogador 2 é confessar, pois -6 é melhor que -10. Se o jogador 1 não confessar, a melhor resposta do jogador 2 é confessar, pois 0 é melhor que -1. (Observe que esse raciocínio é muito semelhante ao raciocínio usado para identificar estratégias dominantes.)

As melhores respostas do jogador 1 estão circuladas em azul. Se o jogador 2 confessar, a melhor resposta do jogador 1 é confessar, pois -6 é melhor que -10. Se o jogador 2 não confessar, a melhor resposta do jogador 1 é confessar, pois 0 é melhor que -1.

O equilíbrio de Nash é o resultado em que há um círculo verde e um círculo azul, pois isso representa um conjunto de melhores estratégias de resposta para ambos os jogadores. Em geral, é possível ter vários equilíbrios de Nash ou nenhum (pelo menos em estratégias puras, como descrito aqui).

Você deve ter notado que o equilíbrio de Nash neste exemplo parece subótimo de uma maneira (especificamente, por não ser o Pareto ideal), pois é possível que ambos os jogadores recebam -1 em vez de -6. Este é um resultado natural da interação presente na teoria do jogo, não confessar que seria um estratégia ideal para o grupo coletivamente, mas incentivos individuais impedem que esse resultado seja alcançado. Por exemplo, se o jogador 1 pensasse que o jogador 2 permaneceria em silêncio, ele teria um incentivo para classificá-lo em vez de ficar em silêncio e vice-versa.

Por esse motivo, um equilíbrio de Nash também pode ser pensado como um resultado em que nenhum jogador tem um incentivo para se desviar unilateralmente (ou seja, sozinho) da estratégia que levou a esse resultado. No exemplo acima, uma vez que os jogadores decidem confessar, nenhum dos jogadores pode fazer melhor mudando de idéia sozinho.