sábado, 2 de agosto de 2014

Luciano Huck coloca um Dilema dos Prisioneiros na TV

Versões televisivas do dilema dos prisioneiros não são incomuns. Silvio Santos em 2002 decidiu implementar um jogo chamado 7 e Meio em que na final dois oponentes, depois de terem derrotado outros adversários, ficavam frente a frente no palco e escolhiam entre o 7, que significava tentar ficar com o prêmio inteiro (não cooperando com o oponente) ou 1/2 (Meio), aceitando partilhar o prêmio (em que, no caso, os dois dividiriam uma quantia menor).

Sabendo-se que o Silvio Santos está sempre ligado no que acontece em programas de auditório dos Estados Unidos, é bem provável que o famoso patrono da SBT tenha copiado o 7 e Meio de versões televisivas do jogo que foram ao ar nos Estados Unidos.

O Dilema dos Prisioneiros é um dos jogos mais exemplares do estudo de economia e de Teoria dos Jogos. É bastante utilizado para se exemplificar o conceito de Equilíbrio de Nash e explorar suas consequências e conceitos. O jogo batizado foi por A. W. Tucker (orientador do Nash) de "Dilema dos Prisioneiros" e foi proposto pelos matemáticos Merrill Flood e Melvin Dresher, que tentaram entender melhor o recém publicado trabalho de John Nash de 1951, que definia um conceito de equilíbrio diferente daquele de maximin/minimax estipulado por Von Neumann e Morgenstern no livro que lançou os fundamentos da área de teoria dos jogos (Theory of Games and Economic Behaviour). O Dilema dos Prisioneiros pode ser definido de diversas formas, uma das mais interessantes descrições que encontrei sobre o jogo foi a que está presente no documentário The Trap Ep.2 (documentário crítico da BBC bastante interessante sobre Teoria dos Jogos, Economia, Política e tudo mais). O texto do documentário expõe o jogo da seguinte forma (tradução livre):

"Um jogo famoso foi desenvolvido na RAND para mostrar que, em qualquer interação, o egoísmo sempre leva para um resultado mais seguro. Ele foi chamado de "Dilema dos Prisioneiros". Há muitas versões, mas todas elas envolvem dois jogadores que devem decidir confiar ou trair um ao outro. Imagine que você roubou o diamante mais valioso do mundo. Você ficaria feliz em vendê-lo a um perigoso gangster, ele propôs encontrá-lo para que você fizesse a troca pelo dinheiro, mas você acha que ele poderá te matar. Então, ao invés disso, você oferece a ele levar o diamante para um lugar remoto (remote field, no original) e escondê-lo. Ao mesmo tempo, ele deverá ir para outro lugar remoto, a milhas de distância, e esconder o dinheiro. Então, você ligará para ele e cada um contará ao outro o lugar do esconderijo. Mas segundos antes de fazer essa ligação você percebe que você pode traí-lo: você fica com o diamante e pode ir pegar o dinheiro (enquanto isso o gangster se dirigiria para uma busca infrutífera em um lugar vazio). Mas no mesmo exato momento, você percebe que ele provavelmente está pensando na mesma coisa que você e que ele pode traí-lo. Não há como você prever como a outra pessoa irá se comportar. Este é o dilema. Mas o que as equações de Nash mostraram é que a escolha racional [deste jogo] é sempre trair a outra pessoa, pois dessa maneira, no pior caso, você ficará com o diamante, e no melhor deles, ficará com o diamante e o dinheiro. Mas se você confiar na outra pessoa você se arriscará a perder tudo pois ela poderá traí-lo, isto foi chamado de payoff do otário."

Não é que hoje vi rapidamente na televisão uma versão revisada do jogo no programa Caldeirão Do Huck. Na versão do Huck o jogo foi chamado de "Quem Fica Com Tudo?". Não vi o programa inteiro, parece que na versão do Huck também haviam mais jogadores, e dois foram selecionados para se aporem frente a frente na final. Pois bem, no programa transmitido de hoje havia duas jogadoras: Dahyanna e Laura. Na etapa final as jogadoras tinham duas opções: "Ficar com Tudo" (F) ou "Dividir" (D). Se ambas decidissem ficar com tudo (declarar F) ninguém ganharia nada. Se apenas uma delas decidisse dividir (declarar D) e a outra decidisse ficar com tudo (declarar F), a pessoa que declara F sozinha leva o maior prêmio e a que escolheu dividir fica com nada. Caso as duas escolham dividir elas ficam com um prêmio menor (asseguram o que elas já haviam conseguido na etapa anterior).

Vamos chamar de 'T' o maior premio e de 'm' o prêmio assegurado pela divisão. Caso os jogadores não cheguem num acordo eles ficam com zero. Suponhamos então que T > m > 0. O Dilema dos Prisioneiros apresentado no programa do Huck é uma forma ainda mais cruel do que sua versão original, pois o jogo não possui estratégia dominante e trair mutualmente não dá garantia nenhuma para nenhum dos jogadores. Vejamos o jogo do programa na sua forma normal em que os payoffs de Dahyanna são apresentados no lado esquerdo do parenteses e o de Laura no lado direito:

--------------------------_______________________
--------------------------|-----|-----Laura-----|
--------------------------|_____|_______________|
--------------------------|-----|-------|-------|
--------------------------|-----|---F---|---D---|
--------------------------|_____|_______|_______|
--------------------------|-----|-------|-------|
--------------------------|--F--|-(0,0)-|-(T,0)-|
---------------Dahyanna---|_____|_______|_______|
--------------------------|-----|-------|-------|
--------------------------|--D--|-(0,T)-|-(m,m)-|
--------------------------|_____|_______|_______|

Ao contrário do Dilema dos Prisioneiros usual, que possui apenas um equilíbrio, o jogo acima possui três equilíbrios de Nash, a saber as ações FF, FD ou DF. Quando estava assistindo o programa formulei rapidamente a matriz para conferir se o resultado do jogo coincidiria com a predição do equilíbrio. Na verdade, eu esperava mesmo que o equilíbrio não se verificasse dado que existem estudos mostrando que as pessoas tendem a cooperar mais (talvez uma certa aversão ao risco se aplicasse sobre as utilidades daqueles payoffs). O que me levantava a dúvida era de que, ao que me parecia, os prêmios de m eram muito menores do que os de T, ou seja, cooperar (Dividir) não dava nenhuma grande vantagem às jogadoras já que T >> m. Ainda assim, o resultado final permanecia um mistério, pois o jogo acima possui três equilíbrios e não apenas um único.

O resultado final de hoje foi o equilíbrio abaixo assinalado:

--------------------------_______________________
--------------------------|-----|-----Laura-----|
--------------------------|_____|_______________|
--------------------------|-----|-------|-------|
--------------------------|-----|---F---|---D---|
--------------------------|_____|_______|_______|
--------------------------|-----|-------|-------|
--------------------------|--F--|-(0,0)-|-(T,0)-|
---------------Dahyanna---|_____|_______|_______|
--------------------------|-----|-------|-------|
--------------------------|--D--|-(0,T)-|-(m,m)-|
--------------------------|_____|_______|_______|

Dahyanna decidiu jogar "Ficar com Tudo" e Laura decidiu na última hora "Dividir". Mais uma diferença em relação ao Dilema dos Prisioneiros original ocorreu no programa do Caldeirão do Huck: no jogo original os jogadores não se comunicam antes de tomarem suas decisões e no programa do Caldeirão isso era estimulado e televisionado. Laura ameaçou Dahyanna dizendo que iria jogar "Ficar com Tudo", mas que poderiam depois, em acordo externo ao que parece, 'rachar' o dinheiro. Ou seja, Laura acrescentou mais uma dimensão ao jogo (veja a forma extensiva abaixo), porém, Dahyanna rechaçou verbalmente a proposta dizendo que não podia confiar na Laura (afinal se Laura jogasse F ela não tinha realmente o que fazer e se tornaria indiferente). O final foi que Laura não manteve sua ameaça e jogou "Dividir" e Dahyanna jogou para ficar com tudo, deu o equilíbrio acima assinalado.

Como o jogo colocou uma comunicação, vamos analisar se a proposta da Laura era realmente crível. Para isso vejamos o jogo na forma extensiva. Laura propôs dividir o prêmio total caso Dahyanna concordasse em Dividir na primeira etapa, e sabemos que os valores de m são muito baixos, então, dividir o prêmio principal é ainda melhor que colaborar na primeira rodada (T/2 > m). No entanto, a proposta de colaboração da Laura não era crível como se diz em Teoria dos Jogos, pois nada poderia garantir à Dahyanna que Laura coloboraria depois do jogo encerrado, ou seja, que dividiria o prêmio maior. Vemos que os equilíbrios não se alteram de maneira nenhuma.

Figura 1 - Versão do Jogo na forma extensiva com alguma, simultâneo na primeira mas com uma proposta de divisão na segunda rodada.



Um melhor comportamento para a Laura seria parecer mais ameaçadora, fazendo Dahyanna de fato acreditar que ela jogaria F em qualquer circunstância. Ainda que isso deixasse Dahyanna indiferente, ganhando zero, isso aumentaria as chances de se pensar que uma cooperação posterior seria possível. Também ajudaria caso Laura tentasse mostrar que não atingir uma cooperação (os payoffs 0,0) é na verdade uma situação pior do que as outras situações, ou tentar mostrar que gostaria de ficar no (0,0) só para ver a amargura da adversária. Isso envolveria jogar com a subjetividade do outro e com a própria, sendo que os payoffs se tornariam mais subjetivos.

Finalmente, não dá pra prever muito o que vai acontecer nos jogos seguintes do "Quem Fica com Tudo?" isso porque existem três equilíbrios diferentes. Outro ponto interessante é que as pessoas podem aprender assistindo aos outros programas, se o aprendizado ocorrer, o equilíbrio FF pode se tornar mais comum. Porém, com o tempo, se FF é bastante comum, os jogadores podem aprender sobre isso e atingir um equilíbrio DD, mas se isso se tornar comum, desviar pode se tornar uma vantagem, enfim, uma série de considerações de jogos repedidos com jogadores diferentes pode acontecer aqui e a coisa ficar mais complexa.

P.S.: Em breve volto aqui para falar do IWGTS 2014 do qual participei como ouvinte nessa semana que se encerrou. O blog Prosa Econômica já postou sobre isso em um material com excelentes fotos.

2 comentários:

Unknown disse...

Muito boa análise!
Às vezes a TV tem seus momentos interessantes!
Renato

Thiago disse...

https://www.youtube.com/watch?v=S0qjK3TWZE8