4. Jak poznat jestřáby od holubic

Když lvice válčí s přeludem
Achillova pata Půjčky za oplátku
Nastupuje Pavlov
O zbabělých rybách
První moralisté
Dá se rybám věřit?


[...]


Achillova pata Půjčky za oplátku

[...]

V jednom důležitém ohledu však Binmore a další kritikové měli pravdu. Axelrod se uspěchal, když tvrdil, že Půjčka za oplátku je "evolučně stabilní" - tím chtěl říct, že populace hrající podle Půjčky za oplátku jsou imunní vůči jiným strategiím. Tento jeho závěr zpochybnily další počítačově simulované turnaje, které se podobaly Axelrodovu třetímu experimentu. Rob Boyd s Jeffreym Lorberbaumem při nich ukázali, že lze formulovat pravidla, za nichž lze Půjčku za oplátku porazit.

Shrňme si jejich experimenty. Hrály při nich náhodně smíšené strategie, které soutěžily o omezený prostor a rozmnožovaly se úměrně k počtu bodů získanému v minulé hře. Mohly získat 5, 3, 1 nebo 0 bodů. Za takové situace se nejprve daří zlým strategiím typu Vždy podváděj, jež zneužívají naivní kooperativní programy a vytlačují je z monitoru. Brzy se jim ale přestává dařit, protože převážně narážejí na obdobně zlé strategie. Při takovém setkání mohou získat maximálně 1 bod. Nyní nastává chvíle pro Půjčku za oplátku. Hraje-li proti Vždy podváděj, začne soupeře podrážet a připraví ho o pětibodové zisky; pokud ale hraje s jinou Půjčkou za oplátku, spolupracuje s ní a získává 3 body. A jakmile kooperativní program najde několik partnerů, s nimiž utvoří vzájemně spolupracující kroužek, začne se mu dařit a dožene program zdy podváděj k zániku.

Nyní se však ukáže, že ani Půjčka za oplátku není dokonalá. Například ji ohrožují omyly. Vzpomeňme si, že spolupracuje, dokud nenarazí na podraz, který obratem trestá. Když se setkají dvě Půjčky za oplátku, mohou spolu štastně kooperovat, pokud ovšem žádný z programů neudělá třeba jen náhodnou chybu. V tu chvíli mu totiž partner oplatí zlé zlým, takže zakrátko oba uvíznou ve vyčerpávajícím kolotoči vzájemné msty. Až příliš reálným příkladem ze života jsou situace, kdy terorista z IRA míří na britského vojáka, ale omylem zasáhne náhodného protestantského civilistu. Taková chyba může vyprovokovat pomstu na náhodně vybraném katolíkovi, kterého odstřelí protestantský ozbrojenec, za to se katolíci pomstí atd. ad infinitum. Takovým sériím zbytečných smrtí se v Severním Irsku léta říkalo "vražda za oplátku".

Tyto slabé stránky "hodného" programu napovídají, že k úspěchům Půjčky za oplátku v Axelrodových simulacích značně přispěla pravidla hry. Při počítačových turnajích se jeho slabosti neprojevily. Ve světě, kde dochází k náhodným chybám, je Půjčka za oplátku druhořadou strategií, nebot celé řadě strategií se daří lépe. Axelrodovy jasné závěry se začaly rozplývat, jakmile jiní programátoři vytvořili sofistikovanější, trochu více vyšperkované strategie.


Nastupuje Pavlov

Přesuneme se nyní do Vídně, kde jistý Karl Sigmund, mladý matematik s hravou myslí, pořádal jednoho dne koncem 80. let seminář o teorii her pro své studenty. Jeden z nich, jistý Martin Nowak, se rozhodl zanechat chemie, kterou do té doby studoval, a plně se oddat teorii her. Sigmunda zaujalo Nowakovo nadšení a navrhl mu, aby se pokusil prodrat houštinami komplikací, jež se v dobách po Půjčce za oplátku rozbujely okolo Vězňova dilematu. Zkus najít dokonalou strategii pro reálný svět, řekl mu Sigmund.

Nowak připravil zcela jiný typ turnaje. Nic v něm nebylo jisté, vše se řídilo rozmary statistiky. Strategie podle určitých pravděpodobností náhodně chybovaly, nebo podle probabilistických návodů měnily své taktiky. Systém se však mohl "učit", a to tak, že si pamatoval zlepšení a upouštěl od neúspěšných taktik. Dokonce i pravděpodobnosti, s nimiž se různé věci děly, podléhaly postupným evolučním změnám. Tento nový realismus umožnil mnohá zlepšení, především však programy zbavil všech zbytečných kudrlinek. Místo aby se v turnajích dařilo stejně dobře několika podobným strategiím, vyšel z nich jasný vítěz. Nebyla jím Půjčka za oplátku, ale její velmi blízký příbuzný, takzvaná Velkorysá půjčka za oplátku (angl. Generous-Tit-for-tat). Říkejme ji stručně Velkorysá (Generous).

Velkorysá občas odpouští ojedinělé chyby. Přesněji řečeno, zhruba ve třetině případů velkodušně přehlédne zradu, pokud se neopakuje. Kdyby odpouštěla všechny neopakované zrady - což dělá strategie zvaná Tit-for-two-tats, Dvě půjčky za oplátku - pouze by na sebe přivolala potíže. Když však odpouští náhodně a se zhruba třetinovou pravděpodobností, dokáže prolomit cykly vzájemné msty a současně zůstává imunní vůči vytrvalým podvodníkům. Velkorysá se v počítači rozšíří na úkor Půjčky za oplátku, pokud hraje v počítači obydleném Půjčkami za oplátku, které příležitostně chybují. Půjčka za oplátku tak ironicky dláždí cestu pro ještě dobromyslnější strategii, než je sama. Je Janem Křtitelem, nikoli mesiášem.

Ale ani Velkorysá není mesiáš. Je totiž tak velkorysá, že umožní šíření dalším, ještě dobrotivějším strategiím. Mezi hráči Velkorysé může prosperovat třeba i primitivní strategie Vždy spolupracuj, ačkoli Velkorysou nikdy neporazí; může však díky ní vstát z mrtvých. Jenže Vždy spolupracuj je natolik dobrácká strategie, že snadno padne za oběť nejkrutější ze všech strategií, programu Vždy podváděj. Mezi hráči Velkorysé nemá Vždy podváděj šanci. Jakmile ale někdo začne hrát Vždy spolupracuj, Vždy podváděj zaútočí. Takže náš štastný svět recipročního altruismu je uspořádán tak, že Půjčka za oplátku připraví cestu Velkorysé, ta pomůže hře Vždy spolupracuj, což rozváže okovy trvalému podvádění. Axelrod se v jednom svém závěru mýlil: stabilní závěr hry neexistuje.

Na začátku léta 1992 se Sigmund s Nowakem trápili zjištěním, že hra na Vězňovo dilema nemá žádné stabilní řešení. Tak nehezké závěry totiž pracovníci v oblasti teorie her nemají rádi. Shodou okolností však měla Sigmundova manželka, historička, trávit léto na hradě Rosenburg, pohádkovém hraběcím sídle v dolnorakouském Waldiertelu, aby tam zkoumala historii místního šlechtického rodu. Sigmund vyzval Nowaka, aby manžele doprovázel, a oba matematici si na hrad přivezli přenosné počítače, na kterých soutěžili v řešení vězeňského dilematu. Šlechtické sídlo dnes slouží jako sokolnická škola a oba vědce každé dvě hodiny rušily nálety orlů královských, kteří se z výšky tisíce stop snášeli na zámecký dvůr. Rytířské turnaje, které spolu sváděli v nitru svých počítačů, tak probíhaly v ideálních středověkých kulisách.

Začali na samotném počátku a zahrnuli do seznamu svých turnajů všemožné strategie, které předtím zavrhli. Hledali tu, která nejenže zvítězí, ale udrží se i po skončení turnaje ve stabilním stavu. Zkusili svým programům vylepšit paměť. Místo aby si jejich nové strategie podobně jako Půjčka za oplátku pamatovaly pouze poslední spoluhráčův tah, začaly si pamatovat i poslední vlastní reakci a řídily se podle ní. Jednoho dne, a to docela náhle, zatímco se za okny snášeli majestátní orli, se dostavila inspirace. Ke slovu se dostala stařičká strategie, kterou jako první nevyzkoušel nikdo menší než Rapoport. Ten onu strategii odmítl jako beznadějnou a označil ji jménem Prosťáček (angl. Simpleton). Beznadějná se mu však jevila jen proto, že ji zkoušel proti Vždy podváděj, vedle níž byl Prosťáček vskutku až příliš naivní. Jenže Nowak a Sigmund to s Prosťáčkem zkusili ve světě ovládaném Půjčkou za oplátku a v takovém světě Prosťáček nejenže porazil starého profíka, ale navíc se i následně ukázal jako neprůstřelný. I když naivkové neporazí notorické podrazáky, dokážou se vecpat před světla ramp, jakmile Půjčky za oplátku podrazáky zlikvidují. Půjčka za oplátku opět hraje roli Jana Křtitele.

Prosťáčkovi se jiným jménem říká Pavlov, ačkoli toto jméno je ještě víc zavádějící: jeho strategie není vůbec reflexivní. Nowak připouští, že by ji měl nazývat přesným, leč neobratným jménem Vyhráváš-zůstaň/Prohráváš-prchej (angl. Win-stay/Lose-shift), ale příliš se mu do toho nechce, takže strategii jméno Pavlov zůstává. Pavlov se chová jako poněkud prostoduchý hazardní hráč rulety. Pokud vyhraje na červené, sází i v příští hře na červenou; pokud prohraje, zkusí to příště na černé. Za výhru si počítejte 3 nebo 5 (odměna nebo pokušení), za prohru 1 nebo 0 (trest a oškubaná kavka). Tento princip - neměnit své každodenní chování, dokud se nestane nějaký průšvih - je základem mnoha našich aktivit, třeba výchovy dětí a výcviku psů. Psy i děti vychováváme s předpokladem, že budou pokračovat v činnostech, za které je odměníme, a zanechají aktivit, za něž je trestáme.

Pavlov je podobně jako Půjčka za oplátku laskavý, neboť zahajuje spolupráci; chová se recipročně, neboť svým partnerům oplácí dobré dobrým; a umí odpouštět jako Velkorysá, neboť trestá za chyby, ale pak se vrací ke spolupráci. Má však v sobě i kousek zlomyslnosti, který mu umožňuje zneužívat kooperující naivky jako Vždy spolupracuj. Jestliže narazí na kavku, nepřestane na ni dorážet. Tak vytváří kooperativní svět, ale nedopustí, aby se takový svět zvrhl v přespříliš důvěřivou Utopii, kde by se dařilo bezohledným vyžírkům.

Jenže Pavlovovy slabosti byly dobře známy. Rapoport ukázal, že bývá bezbranný tváří v tvář zlovolné strategii Vždy podrážej. Neustále s ní totiž zkouší spolupracovat, čímž si zaslouží, že je "oškubán jako kavka". Právě proto se mu původně říkalo Prosťáček. Pavlov se tudíž nerozšíří, dokud Půjčka za oplátku neodvede špinavou práci a nezbaví svět špatných chlapců. Nowak a Sigmund ale ukázali, že Pavlov trpěl touto chybou pouze v deterministickém světě - ve světě, kde jsou strategie jednotlivých hráčů předem definovány. Zato v mnohem realističtějším světě pravděpodobnosti a učení, v němž si každá strategie hází kostkou, aby rozhodla, jak se zachová příště, se dělo cosi podivného. Pavlov své pravděpodobnosti záhy přizpůsobil tak, že Vždy podváděj nedokázal ohrozit jeho převahu. Dosáhl tak skutečné evoluční stability.


O zbabělých rybách

Řídí se lidé a zvířata strategií Pavlov? Do chvíle, kdy Nowak a Sigmund publikovali své myšlenky, byly jedním z nejlepších příkladů strategie Půjčka za oplátku ve světě zvířat experimenty, které Manfred Milinski podnikal s rybami jménem koljušky. [...]

[...]

Možná se vám zdá absurdní, že někdo očekává u ryb stejné reakce jako u znalců sofistikovaných kliček z teorie her. Naše teorie však ani v nejmenším nevyžaduje, ahy ryby chápaly, co dělají. Reciprocitu si mohou vyvinout i zcela nechápavé automaty, jestliže se s jinými automaty střetávají v situacích, jež připomínají Vězňouo dilema - což ostatně víme z počítačových simulací. O vypracování strategie se nestarají ryby, ale evoluce, a ta může ryby příslušným způsobem naprogramovat.

Pavlovem celá historie nekončí. Jakmile Nowak přesídlil do Oxfordu, stalo se v Cambridgi věcí cti, aby někdo přišel se strategií, jež by Pavlova překonala. Vrženou rukavici zdvihl Marcus Frean. Vyzkoušel nový trik a začal hrát Vězňovo dilema s mnohem realističtějšími pravidly, kdy oba hráči nemusejí jednat simultánně. Ani jihoameričtí upíři si své reciproční služby neprokazují současně. Střídají se při nich - nemělo by smysl, aby si jídlo vyměňovali jen tak pro legraci. Frean ve svém počítači rozehrál turnaje v takových "Vězňouých dilematech na oplátku"; a při nich se - nikoli překvapivě - vyvinula strategie, která Pavlova porazila. Frean ji nazval Přísná, ale spravedliuá. I ona podobně jako Pavlov odměňuje spolupráci, obnovuje spolupráci po vzájemné zradě a naivky trestá dalšími podrazy. Na rozdíl od Pavlova však spolupracuje i poté, co ji v předchozím kole obrali jako kavku. Je tudíž trochu dobromyslnější.

Význam této strategie není v tom, že by se stala novým božstvem, ale ve zjištění, že jakmile je hra asynchronní, uvážlivá velkorysost se vyplácí více než jindy. To odpovídá selskému rozumu. Musíte-li jednat dříve než váš spoluhráč, vyplatí se vám zkusit to se spoluprací a zachovat se slušně. Jinými slovy, na cizí lidi se bezdůvodně nemračíte, jinak si o vás udělají špatný dojem. Zdravíte je s úsměvem.


První moralisté

Zde nám však vyvstává jiný a vážnější problém. Vězňovo dilema je zápas pro dva hráče. Z dosavadních výsledků se zdá, že spolupráce se vyvine, hrají-li spolu dva hráči, kteří hrají nekonečně dlouho. Jinými slovy, ve světě, kde se můžete setkat pouze s vaším nejbližším sousedem, se vám vyplatí chovat se k němu slušně. Jenže svět vypadá jinak.

Pouhé reciprocitě trvalo i v rámci dvojice pořádně dlouho, než hráče přinutila ke spolupráci: oba hráči si své vztahy musí upravit tak, aby si byli jistí, že až se setkají někdy příště, navzájem se poznají. O kolik těžší to musí být například v trojici hráčů? A co když je hráčů ještě víc? Čím větší jsou skupiny, tím nedostupnější jsou zisky ze spolupráce a tím větší překážky se spolupráci staví do cesty. [...]

[...]

S problémem "vyžírků" ve velkých skupinách si možná může poradit i méně drastické opatření: společenský ostrakismus. Pokud lidé rozpoznají podvodníky a podrazáky, mohou s nimi jednoduše přestat hrát. To podvodníky účinně připraví o Pokušení (5), Odměnu (3) a dokonce i Trest (1); pak nemohou sbírat vůbec žádné body.

Filozof Philip Kitcher naprogramoval hru "Příležitostné Vězňovo dilema", kterou chtěl prozkoumat možnosti ostrakismu. Usídlil ve svém počítači hráče čtyř strategií: diskriminující altruisty, kteří hrají jen s těmi, kdo je nikdy předtím nezradili; úmyslné podrazáky, kteří zrazují za všech okolností; samotáře, kteří se vyhnou jakémukoli styku s ostatními; a konečně občasné podrazáky, kteří ochotně hrají s každým, kdo je ještě nezradil - aby jej vzápětí zradili.

Diskriminující altruisté (DA) okamžitě převládnou v populaci samotářů, protože se navzájem najdou a sklízejí body ze spolupráce. Pak ale občasní podrazáci nedokážou proniknout do populace složené ze samých DA, zatímco DA se úspěšně zabydlují mezi občasnými podrazáky. Jinými slovy, diskriminující altruismus, který připomíná "hodnější" Půjčku za oplátku, může převládnout nad populacemi asociálů. Přitom však diskriminující altruismus není stabilnější než samotná Půjčka za oplátku, neboť jej mohou vytlačit strategie, které spolupracují s každým bez rozdílu. Jeho úspěch však poukazuje na možný význam ostrakismu při řešení Vězňouých dilemat v reálném životě.

Kitcherovy programy vycházely výhradně z předešlého chování jednotlivých partnerů; ti na základě minulých zkušeností usuzovali, zda lze spoluhráčům věřit. Na potenciální altruismus však nemusíme usuzovat jen retrospektivně. Možná lze již předem poznat potenciální zrádce a vyhýbat se jim. Ekonom Robert Frank tento problém zkoumal experimentálně. Shromáždil v místnosti na půl hodiny lidi, kteří se vůbec neznali; nato je postupně vyzval, aby v soukromí označili ty osoby, jež by podle jejich názoru při hře na Vězňouo dilema spolupracovaly, a odlišili je od těch osob, které by podrážely. Dotazovaní měli výrazně lepší odhad, než by odpovídalo náhodě. Po pouhé půlhodině známosti dokázali předpovědět, nakolik jsou jejich bližní ochotní ke spolupráci.

Frank v tom nevidí nic překvapivého. Ušichni po velkou část našich životů odhadujeme charakter a spolehlivost cizích lidí. Pro případné nedůvěřivce připravil myšlenkový experiment: "Přemýšlejte o lidech, které znáte (a nikdy jste nesledovali jejich chování ve vztahu k zákonu o odpadech). Dovedete mezi nimi vyjmenovat ty, o nichž si myslíte, že by cestovali pětačtyřicet minut autem, jen aby řádně uložili nebezpečný pesticid? Pokud ano, pak jste potvrdili předpoklad, že lidé dokážou odhadovat charaktery svých bližních.""


Dá se rybám věřit?

Našli jsme tedy jeden důležitý důvod, proč se k ostatním chovat slušně: jen tak je přesvědčíme, aby s námi hráli. Odměna za spolupráci ani pokušení nabízené zradou nejsou dopřány těm, kdo neprokážou svou spolehlivost a nevybudují si na jejím základě dobrou pověst. Jen ten, kdo kooperuje, má s kým kooperovat.

Rozumí se, že má-li takový systém fungovat, musí se jednotlivci navzájem poznat. To ovšem není snadné. Nemám tušení, zda sleď v desetitisícovém rybím hejnu nebo mravenec v kolonii o desítkách tisíc členů zná své kolegy natolik, aby si mohl říct: "A hele, tamhle je starý dobrý Fred." Nejspíš si to nikdy neřekne. Zároveň si však jsem skoro jist, že takoví kočkodani poznají zrakem a sluchem všechny členy své tlupy; primatologové Dorothy Cheneyová a Robert Seyfarth to prokázali s dostatečnou jistotou. Z toho plyne, že u opic jsou na rozdíl od sleďů přítomny všechny předpoklady pro vznik recipročního altruismu.

[...]

Ať jsou koljušky jakkoli inteligentní, nikdo nepochybuje, že vůbec nejlépe budeme Vězňova dilemata řešit my lidé. Vděčíme za to naší fantastické schopnosti pamatovat si tváře i těch nejpovrchnějších známých, naší dlouhověkosti a paměti. Je jasné, že mezi všemi druhy na této planetě splňuje právě náš druh všechny předpoklady pro turnaje ve Vězňovu dilematu - jimiž jsou podle Nowaka "schopnost opakovaně se setkávat, poznat se a zapamatovat si důsledky minulých setkání". Právě to na nás může být zvláštní: jsme výjimečně dobří v recipročním altruismu.

Přemýšlejte o tom: reciprocita visí jako Damoklův meč nad každou lidskou hlavou. Zve mě na ten večírek, jen abych napsal dobrou recenzi na jeho knížku. Byli u nás dvakrát na večeři a nikdy nás nepozvali na oplátku. Jak mi to mohl udělat po všem, co jsem pro něj udělal já? Pokud mi tentokrát vyhovíš, slibuji, že ti to oplatím. Čím jsem si zasloužil takové jednání? Dlužíš mi něco. Závazek, dluh, pozornost, protislužba, dohoda, smlouva, obchod... Naším jazykem a našimi životy prostupují myšlenky na reciprocitu. A nikde to není tak nápadné jako ve vztahu k jídlu.


Zpět na obsah