3. Vězňovo dilema

Naučil jsem se prokazovat službu druhému, aniž bych mu ve skutečnosti poskytl jakoukoli laskavost. Předvídám totiž, že mi dotyčný se stejným očekáváním službu oplatí, aby tak zachoval vzájemné poskytování laskavostí se mnou i s druhými. A když jsem mu tedy posloužil a on si užívá výhod vyplývajících z mého činu, pociťuje, že je řada opět na něm, neboť předvídá důsledky, jež by mělo jeho odmítnutí.

David Hume

Jestřábi a holubice
Krvaví pokrevní bráškové


[...]

Hra, nazvaná Vězňovo dilema, přichází ke slovu vždy, kdy se sobecký zájem jedince dostane do rozporu se zájmy celku. [...]

Vězňovo dilema je jasným příkladem situace, kdy dochází ke spolupráci mezi egoisty - spolupráci, kterou nemusí sankcionovat žádná tabu, morální zábrany nebo mravní imperativy. Jak mohou jedinci sledovat své sobecké zájmy a přitom sloužit zájmům celku? Název Vězňovo dilema získala hra podle anekdoty, kterou bývá nejčastěji uváděna: dva vězni mají na vybranou, zda budou svědčit jeden proti druhému - mohou tak ovlivnit výši svého trestu. Dilema jejich situace je v tom, že pokud budou oba mlčet, policie je obžaluje pouze z mírnějšího přestupku. Jestliže ani jeden nepromluví, budou na tom lépe, než když se navzájem obviní. Z hlediska každého z nich je však výhodnější, jestliže promluví, podrazí svého komplice a sám vyvázne bez trestu.

Proč? Zapomeňte na vězně a přemýšlejte o prosté matematické hře pro dva hráče, kterou byste hráli o body. Budete-li oba kooperovat ("mlčet"), dostane každý z vás tři body (říkejme jim "odměna"); jestliže se navzájem podrazíte, dostanete po jednom bodu ("trest"). Pokud se však jeden zachová neloajálně, zatímco druhý zůstane solidární, nedostane solidární hráč nic (je jako oškubaná kavka), kdežto podrazák dostane pět bodů ("pokušení"). Z toho plyne, že pokud váš spoluhráč podvádí, měl byste také podvádět. Dostanete jeden bod místo žádného. A pokud náhodou spolupracuje, o to víc se vám vyplatí ho podrazit: dostanete pět bodů místo tří. Ať váš spoluhráč dělá cokoli, pokud ho podrazíte, vždy jen získáte. Pravda, on většinou přemýšlí stejně jako vy, takže výsledkem je vzájemná remíza: získáte každý po jednom bodu, místo abyste oba získali body tři.

Nenechte se oklamat svou slušností. To, že byste oba raději šlechetně kooperovali, je pro naši otázku zcela irelevantní. Nezabýváme se totiž "správným" jednáním, ale hledáme logicky "nejlepší" postup bez ohledu na morálku. A tím je podraz. Ten, kdo jedná sobecky, se chová racionálně.

[...]

[...] Obecně vzato, každá situace, kdy jste v pokušení něco udělat, ale přitom víte, že pokud se všichni zachovají stejně, stane se průšvih, je pravděpodobně příkladem Vězňova dilematu [...]. Pokud bychom mohli všem lidem věřit, že nebudou krást auta, nemuseli bychom své vozy zamykat. Tím by se ušetřily ohromné peníze na pojištění, zapezpečovacích systémech a podobně. Každý by na tom jen vydělal. Avšak v takovém důvěřivém světě může jedinec vydělat ještě víc, poruší-li pravidla a začne-li auta krást. I rybáři by určitě netratili, kdyby se každý z nich omezil a nelovil by zbytečně mnoho ryb. Jenže každý loví ze všech sil, takže ten rybář, který by se dobrovolně omezil, by jenom přenechal svůj podíl někomu sobečtějšímu. Za kolektivní individualismus platíme všichni.

Ač to zní bizarně, i tropické deštné lesy vznikly jako důsledek Vězňova dilematu. Stromy, které v nich rostou, vyčerpají převážnou část své energie růstem vzhůru k nebesům, místo aby investovaly do reprodukce. Kdyby se mohly dohodnout s konkurenty, vzájemně by si zakázaly investice do kmenů a dodržovaly by maximální výšku tří metrů, každý strom by na tom byl lépe. Jenže to nejde.

Faktem je, že ekonomie si svou špatnou pověst vysloužila právě tendencí redukovat celou složitost života na jednoduchou hru. Naší snahou však není vtěsnat všechny skutečné životní trable do krabičky s názvem Vězňovo dilema; chceme jen najít idealizovaný popis toho, co se děje, jestliže se individuální a kolektivní zájmy dostanou do konfliktu. S takovým ideálním stavem pak můžeme experimentovat, dokud nepřijdeme na něco překvapivého; nato se můžeme vrátit do skutečného světa a sledovat, zda naše myšlenkové experimenty vrhnou světlo na reálné životní situace.

Právě to se dělo i s hrou na Vězňovo dilema (ačkoli někteří teoretici se návratu do skutečného světa bránili křikem a kopanci). V šedesátých letech hledali matematici s bezmála maniakálním zápalem východisko z temného důsledku Vězňova dilematu - ze zjištění, že jediným racionálním řešením je podraz. Opakovaně prohlašovali, že řešení našli, přičemž nejznámějším optimistou byl Nigel Howard, který teorii přeformuloval s ohledem spíše na činy hráčů než na jejich záměry. Avšak v Howardově řešení paradoxu, stejně jako v jiných navržených východiscích, bylo přání otcem myšlenky. Za daných počátečních podmínek není kooperace logickým řešením.

Tento závěr byl pramálo oblíben, a to nejen pro zdánlivě nemorální důsledky, ale i proto, že odporoval situacím známým z běžného života. Kooperace je běžným rysem lidské společnosti; vzájemná důvěra je základem společenského i hospodářského života. Je však racionální? Musíme překonávat naše instinkty, chceme-li se k sobě chovat hezky? Vyplácí se zločin? Chovají se lidé čestně jen tehdy, jestliže se jim to vyplatí?

V sedmdesátých letech se Vězňovo dilema stalo metaforou pro všechno zlo spojované s ekonomickou posedlostí individuálním ziskem. Jestliže z výsledků hry vyplývalo, že jediným racionálním postojem jednotlivce je sobectví, pak to jen dokazovalo nesmyslnost herních pravidel. Protože zdaleka ne všichni lidé jsou bez výjimky sobečtí, musí je motivovat nikoli osobní prospěch, ale obecné blaho. V tom případě by klasická ekonomie, věda vybudovaná na předpokladu lidského úsilí o osobní prospěch, po dvě století sledovala falešnou stopu.

Dovolme si krátkou odbočku do teorie her. [...] Cílem teorie her je tedy nalezení zjednodušené verze světa - a univerzálních receptů. Mezi specialisty se jim říká Nashova rovnováha podle princetonského matematika Johna Nashe [...]. Nashovy rovnováhy dosáhneme tehdy, jestliže strategie každého z hráčů je optimální odpovědí na strategie ostatních hráčů, přičemž nikdo nemá důvod odchýlit se od své dosavadní strategie.

[...]


Jestřábi a holubice

Objevil se však experiment, který tento závěr postavil na hlavu. Ukázalo se, že z Vězňova dilematu byly po třicet let odvozovány chybné závěry. Sobectví není ani zdaleka racionální postup, jestliže hru hrajete na víc než jedno kolo.

Je ironií, že řešení této šarády bylo známé od samého počátku. Záhy se však na ně zapomnělo. Flood s Dresherem totiž objevili jeden zajímavý fenomén. Když požádali dva své kolegy, Armena Alchiana a Johna Williamse, aby si hru zahráli o malé peněžní částky stokrát za sebou, jejich pokusní králíci celkem ochotně kooperovali: v šedesáti případech ze sta na sebe byli hodní, a sklízeli tak ovoce ze vzájemné spolupráce. V poznámkách, které si během hry vedli, oba přiznali, že se k partnerovi chovají vstřícně, aby ho svedli ke vstřícnosti v příštím kole - a to až do závěru hry, kdy oba doufali v rychlou koncovku zahranou na úkor protihráče. Když pak jiná dvojice opakovaně hrála na "nekonečný" počet kol, zdálo se, že vstřícnost převažovala nad škodolibostí.

Na turnaj mezi Alchianem a Williamsem se zapomnělo, avšak pokaždé když měli dva lidé hru sehrát, pokoušeli se o spolupráci, tedy o logicky chybnou taktiku. Tato skoro nemístná ochota kooperovat byla blahosklonně omlouvána nedostatečnou racionalitou hráčů a v podstatě nevysvětlitelnými sympatiemi k bližnímu. "Ukazuje se", psal jeden znalec teorie her, "že průměrní hráči nejsou strategicky dost nadaní, aby přišli na to, že strategie DD [oba se podrážejí, z anglického defect - zradit] je jedinou logicky opodstatněnou variantou." Podstata problému všem unikala.

Začátkem 70. let Alchianův - Williamsův turnaj znovuobjevil jeden biolog. John Maynard-Smith, původem inženýr zajímající se o genetiku, nikdy předtím o Vězňově dilematu neslyšel. Tušil však, že teorie her může být v biologii stejně prospěšná jako v ekonomii. Vyšel z předpokladu, že pokud se racionální tvorové rozhodují pro strategie, jež jsou za jakýchkoli okolností nejlepším ze všech špatných řešení, měl by přírodní výběr i u zvířat podporovat ty instinkty, jež by je nutily k následování nejlepších dostupných strategií. Jinými slovy, jak racionální dedukce, tak historické evoluční tlaky by měly vést ke hře v souladu s Nashovou rovnováhou. "Rozhodovat" může nejen jedinec, ale i přírodní výběr. Evolucí vzniklý instinkt odpovídající Nashově rovnováze pojmenoval Maynard-Smith "evolučně stabilní strategie": žádný živočich, který by se jí řídil, by na tom nebyl hůř než živočich, který by se řídil jinou strategií.

Maynard-Smith se nejprve pokusil vysvětlit, proč živočichové při svých zápasech obvykle nebojují až do zabití soupeře. Navrhl podmínky hry, kterou nazval Jestřáb a holubice. Jestřáb, jenž zhruba odpovídá "podrazákovi" z Vězňova dilematu, snadno zvítězí nad holubicí, bude však těžce zraněn, dostane-li se do křížku s jiným jestřábem. Holubice čili ekvivalent "spolupracujícího" vězně získá, setká-li se s jinou holubicí, ale prohraje setkání s jestřábem. Pokud se však hra hraje opakovaně, začne se holubicím jejich měkké srdce postupně vyplácet. Zvlášt úspěšnou strategií je oplácení - holubice se zachová jako jestřáb, jestliže je jestřábem napadena. O této strategii si brzy povíme více.

Ekonomové se o úvahy Maynarda-Smithe nezajímali, protože ve svých publikacích psal biologickou hantýrkou, která jim byla cizí. Koncem 70. let se však začalo dít něco podivného. Svými studenými a tvrdě racionálními mozky se do teorie her pustily počítače. K velkému překvapení však hrály stejně hloupě a naivně jako lidé - vykazovaly iracionální sklon kooperovat. Matematikové bili na poplach. Roku 1979 vyhlásil mladý politolog Robert Axelrod soutěž, která měla tuto podivnost objasnit. Vyzval matematiky, aby napsali programy, které by sehrály 200 kol hry proti všem ostatním programům, samy proti sobě a proti náhodně vybranému programu. Na konci soutěže měly být programy vyhodnoceny podle počtu získaných bodů.

Různě složité programy mu poslalo celkem čtrnáct lidí. Ke všeobecnému údivu se ukázalo, že "hodné" programy byly při hře nejúspěšnější. Žádný z osmi nejlepších programů na počátku hry nepodrazil svého protihráče. Absolutním vítězem se navíc stal vůbec nejhodnější - a nejjednodušší - ze všech programů. Kanadský politolog Anatol Rapoport, který se zajímal o otázky jaderného zbrojení, svého času byl profesionálním pianistou a pravděpodobně věděl o teorii her víc než kdokoli jiný, sepsal primitivní program Tit-for-tat, alias Půjčka za oplátku. Hráč, který se řídí Půjčkou za oplátku, v prvém kole jednoduše spolupracuje a v dalších kolech se zachová tak, jak se k němu naposled zachoval protihráč. V podstatě se jedná o jiný název pro strategii oplácení z teorií Maynarda-Smitha.

Axelrod vyhlásil další soutěž, jejíž účastníci měli napsat program, který by porazil Půjčku za oplátku. Sešlo se celkem 60 programů, ale jediným vítězem se stala... samotná Půjčka za oplátku! Opět se ukázala jako jednička.

V knize, kterou o teorii her Axelrod napsal, se uvádí:

Za ohromný úspěch Půjčky za oplátku může kombinace její vstřícnosti, oplácení, schopnosti odpouštět a čitelnosti. Chová se vstřícně, takže se nedostává do zbytečných konfliktů. Podrazy dokáže oplácet stejnou kartou, a tím protihráče odradí od trvání na tricích, které by na ni chtěli zkoušet. Dokáže odpouštět, takže může obnovit vzájemnou spolupráci. A konečně je dostatečně čitelná, což protihráče motivuje k dlouhodobé spolupráci.

Následující Axelrodův experiment postavil všechny programy proti sobě v jakési darwinovské válce, v níž šlo o "přežití nejzdatnějších". Pokus byl jednou z prvních vlaštovek mnoha pozdějších experimentů s "umělým životem". Přírodní výběr, onu hybnou sílu evoluce, lze na počítači snadno simulovat: softwaroví tvorové se rozmnožují a soupeří o životní prostor na monitoru počítače stejně, jako se skuteční tvorové rozmnožují a soupeří o prostor v reálném světě. V Axelrodově verzi se neúspěšné programy postupně posouvaly k okrajům monitoru, zatímco schopné programy se držely ve středovém poli. Průběh soutěže mezi programy byl fascinující. Na počátku prosperovaly podrazácké strategie na úkor dobromyslných naivků. Pouze tvorové schopní oplácet špatné špatným, například Půjčka za oplátku, drželi s podrazáky krok. Zakrátko však podrazáci vyhubili snadné oběti a nevyhnutelně se začali střetávat s programy stejného založení; tím nastaly i jim zlé časy. Byla to chvíle pro program Půjčka za oplátku, který se nakonec opět zmocnil vlády nad bitevním polem.


Krvaví pokrevní bráškové

Axelroda napadlo, že by jeho výsledky mohly zajímat biology. Spojil se tedy s kolegou z Michiganské univerzity, kterým nebyl nikdo menší než William Hamilton. Toho okamžitě zaujala pozoruhodná shoda okolností. Před více než deseti lety mu mladý postgraduální student z Harvardu, jistý Robert Trivers, ukázal jednu svou esej. Vycházel v ní z předpokladu, že zvířata i lidé obyčejně sledují své sobecké zájmy, a pozastavoval se nad skutečností, že navzdory svému sobectví často spolupracují. Trivers argumentoval, že jednou z příčin takové spolupráce může být "reciprocita": když mě podrbeš na zádech, podrbu tě příště já. Služba, kterou zvíře poskytne jinému zvířeti, může být oplacena stejnou službou o něco později, takže obě zvířata získají; podmínkou je, že zvíře, které službu poskytuje, utrpí menší újmu, než je zisk, který mu z poskytnuté služby vyplyne. Sociálně žijící tvorové tudíž vůbec nemusí být altruističtí, pouze si vzájemně oplácejí služby, po nichž ve svém sobectví touží. Hamilton tenkrát Triversovi dodal odvahu, aby publikoval článek, jenž shrnoval argumenty pro reciproční altruismus a uváděl několik pravděpodobných příkladů. Trivers dokonce zašel tak daleko, že mezi možnostmi testování svých myšlenek uvedl opakovanou hru na Vězňovo dilema; předpověděl rovněž, že čím déle hra potrvá, tím spíše budou hráči kooperovat. Doslova tak Půjčku za oplátku předpověděl.

Nyní, o deset let později, měl Hamilton v ruce matematický důkaz správnosti Triversovy myšlenky. Axelrod a Hamilton spolu otiskli článek "The evolution of cooperation" (Evoluce spolupráce), jímž chtěli na Půjčku za oplátku upozornit i jiné biology. Výsledkem byla pravá exploze zájmu a hledání skutečných příkladů ve zvířecím světě.

[...]


Zpět na obsah