
Taigi, jei įsivaizduojami žaidimai pirmoje dalyje kažkam pasirodė pernelyg nemotyvuojančiais, šį kartą siūlau jums galimybę laimėti tikrą prizą - legendinio Las Vegas kazino "Binions" suvenyrinę kortų kaladę (neparduodamą parduotuvėse), kurią matote kairėje. Įrašo pabaigoje jūsų laukia užduotis, kurią teisingai išsprendusį [vieną] juo ir apdovanosiu.
Trumpai aptarę racionalaus žaidėjo elgesį (vieno žaidėjo mėtomų 2 kauliukų žaidimo pagalba), šį kartą nagrinėsime žaidimus, žaidžiamus ne mažiau nei dviejų žaidėjų. Kiekvienas iš žaidėjų sieks sau palankiausių rezultatų, tačiau jų sprendimai įtakos ir svetimus rezultatus.
Prieš nerdami į naujas užduotis, prisiminkime, ką išmokome pirmoje dalyje:
(1) racionalus žaidėjas renkasi optimalią (naudingiausią) strategiją;
(2) [kartais] optimali strategija egzistuoja net tada, kai žaidėjas iš anksto negali žinoti visos informacijos;
(3) parodėme, kaip pasirinkti optimalią strategiją prognozuojant nežinomą informaciją (kiek akučių išmesime), pasitelkus tikimybių teoriją (kiekvienas 1 kauliuko akučių skaičius iškris vienodą skaičių kartų, jei mėtysime kauliuką pakankamai ilgai).
Trumpai, iš pažiūros neprognozuojamas lošimo kauliukas iš tiesų yra visiškai "nuspėjamas". Jei šį kauliuką laikytume savo žaidimo oponentu, žaisti prieš oponentą (dėl jo veiksmų nuspėjamumo) nebūtų per daug sudėtinga. Tačiau kaip pasikeis mūsų padėtis, kauliuką pakeitus mąstančiu oponentu? Kaip elgsis racionalus žaidėjas šiuo atveju? Kokia bus tokio žaidimo baigtis? Atsakyti į tokius klausimus ir bando žaidimų teorija.
Kalinio dilema
Klasikinis žaidimų teorijos pavyzdys yra kalinio dilema. Įsivaizduokime du atskirai tardomus nusikaltėlius, kuriems kiekvienam tardytojas siūlo išduoti savo bendrą. Jei kažkuris nusikaltėlis išduoda savo draugą, kai tuo tarpu jo draugas tyli - išdavikas paleidžiamas, tuo tarpu neprisipažinęs nusikaltėlis sėda į kalėjimą 10 metų. Jei abu nusikaltėliai išduoda vienas kitą - abu sėda į kalėjimą 5 metams, jei abu tyli - kiekvienas (dėl įkalčių stokos) gauna tik po 1 metus.
Akivaizdu, jog geriausias rezultatas nusikaltėliams būtų abiems tylėti - ir gauti vos po 1 metus. Tačiau pažiūrėkime, kaip šį uždavinį jie sprendžia praktikoje, ir koks rezultatas (dėl to) labiausiai tikėtinas.
Aš, būdamas vienu iš nusikaltėlių, turiu du pasirinkimus - TYLĖTI ir IŠDUOTI - surašykime manęs laukiančius rezultatus į lentelę (kai mano draugas tyli ir kai meluoja atitinkamai):
TYLĖTI: 1M, 10M
IŠDUOTI: 0M, 5M
Nesunku matyti, jog jei mano draugas tyli, man geriau yra rinktis IŠDUOTI (0M vs 1M); jei mano draugas nusprendžia išduoti, man vėl geriau rinktis IŠDUOTI (5M vs 10M). Kadangi ABIEM ATVEJAIS mano rezultatas geresnis IŠDUODANT, mano racionalus pasirinkimas bus IŠDUOTI. Jei mano draugas mąstys kaip aš (t.y. bus racionalus žaidėjas), jis išduos mane - rezultate abu mes praleisime kalėjime po 5 metus. Nors mums abiem geriausias rezultatas būtų TYLĖTI, labiausiai tikėtinas rezultatas yra jog mes abu IŠDUOSIM (laikant, jog žaidimas žaidžiamas vieną kartą ir nei vienas iš mūsų neturime bijoti keršto).
Slapti skaičiai
Grįžkime prie lošimo kauliuko. Žaidimą žaidžia du žaidėjai. Žaidimo eiga: abu žaidėjai meta po 1 lošimo kauliuką - kiekvienas pažiūri iškritusių akučių skaičių, tačiau jo nerodo priešininkui; kiekvienas žaidėjas (nerodydamas savo pasirinkimo priešininkui) ant lapelio užrašo skaičių 0 arba 1; žaidėjai atskleidžia savo išmestų akučių skaičių ir laimėtoju tampa išmetęs didesnį skaičių; laimėtojo gautų taškų skaičius lygus žaidėjų užrašytų skaičių sumai. Žaidimas kartojamas ir jo tikslas yra surinkti daugiau taškų už varžovą.
Koks mūsu planas? Kadangi mes nevaldome nei išmetamo akučių skaičiaus, nei priešininko veiksmų, mūsų vienintelis sprendimas yra ką rašyti - 0 ar 1 - pamačius kiek akučių jau išmetėme. Tokiu būdu mūsų strategija yra funkcija, priklausoma nuo išmestų akučių skaičiaus (i.e. kiekvienam galimam akučių skaičiui turime priskirti skaičių 0 arba 1).
Toliau pastebėkime tai, jog rašydami 0 mažiname, o rašydami 1 - didiname, prizinį fondą, kurį gau laimėtojas. Tokiu būdu būtų racionalu stengtis didinti prizinį fondą tikintis laimėti, ir jį mažinti - tikintis, jog pralaimėsim. Kadangi nežinome, kiek akučių iškrito mūsų priešininkui, tegalime laikyti, jog kiekvienas iš 6 galimų skaičių vienodai tikėtinas. Jei taip, išmetę 1-2-3 mes dažniau pralaimėsim, nei laimėsim, tuo tarpu išmetę 4-5-6 - atvirkščiai. Tada mūsų optimali strategija yra rašyti 0, pamačius iškritusias 1-2-3 akutes - kitaip rašyti 1. Vėlgi, pavyzdys iliustruoja, kad optimalūs sprendimai egzistuoja ir nežinant visos informacijos (įskaitant žaidimo prieš kitą racionalų žaidėją atvejus).
Monetos mėtymas
Taigi, atėjo laikas man ištesėti savo pažadą. Binions suvenyrinių kortų kaladė iškeliaus pas vieną iš teisingai išsprendusių toliau mano siūlomą užduotį (su nugalėtoju susisieksiu, ir dėl pristatymo susitarsime). NERAŠYKITE SAVO ATSAKYMŲ KOMENTARUOSE - siųskite juos mano elektroniniu adresu iki spalio 31d. Rezultatus pranešiu :)
Žaidimą žaidžia du žaidėjai - A ir B. Žaidimo eiga: abu žaidėjai į puodą sudeda po 100 litų; kiekvienas žaidėjas meta po 1 monetą, tačiau rezultato (herbas ar skaičius) oponentui kol kas neparodo (tačiau pats pažiūri); žaidėjas A dabar gali pasirinkti - žiūrėti kas laimėjo arba į puodą įdėti dar 50 litų; jei jis į puodą įdeda dar 50 litų, žaidėjas B gali pasiduoti arba atsakyti tuo pačiu - irgi įdėti dar 50 litų į puodą; jei B pasiduoda, A gauna puodą; kitaip žaidėjai žiūri kas laimėjo, ir laimėtojas gauna puodą (herbas visada laimi prieš skaičių) - arba puodas dalijamas pusiau lygiųjų atveju. Žaidėjai žaidžia šį žaidimą 1 milijoną kartų, A pradeda kiekvieną kartą. Abu žaidžia optimaliai.
Užduotis: kuris žaidėjas laimės ir kiek? pateikite savo atsakymo paaiškinimą
Trumpai aptarę racionalaus žaidėjo elgesį (vieno žaidėjo mėtomų 2 kauliukų žaidimo pagalba), šį kartą nagrinėsime žaidimus, žaidžiamus ne mažiau nei dviejų žaidėjų. Kiekvienas iš žaidėjų sieks sau palankiausių rezultatų, tačiau jų sprendimai įtakos ir svetimus rezultatus.
Prieš nerdami į naujas užduotis, prisiminkime, ką išmokome pirmoje dalyje:
(1) racionalus žaidėjas renkasi optimalią (naudingiausią) strategiją;
(2) [kartais] optimali strategija egzistuoja net tada, kai žaidėjas iš anksto negali žinoti visos informacijos;
(3) parodėme, kaip pasirinkti optimalią strategiją prognozuojant nežinomą informaciją (kiek akučių išmesime), pasitelkus tikimybių teoriją (kiekvienas 1 kauliuko akučių skaičius iškris vienodą skaičių kartų, jei mėtysime kauliuką pakankamai ilgai).
Trumpai, iš pažiūros neprognozuojamas lošimo kauliukas iš tiesų yra visiškai "nuspėjamas". Jei šį kauliuką laikytume savo žaidimo oponentu, žaisti prieš oponentą (dėl jo veiksmų nuspėjamumo) nebūtų per daug sudėtinga. Tačiau kaip pasikeis mūsų padėtis, kauliuką pakeitus mąstančiu oponentu? Kaip elgsis racionalus žaidėjas šiuo atveju? Kokia bus tokio žaidimo baigtis? Atsakyti į tokius klausimus ir bando žaidimų teorija.
Kalinio dilema
Klasikinis žaidimų teorijos pavyzdys yra kalinio dilema. Įsivaizduokime du atskirai tardomus nusikaltėlius, kuriems kiekvienam tardytojas siūlo išduoti savo bendrą. Jei kažkuris nusikaltėlis išduoda savo draugą, kai tuo tarpu jo draugas tyli - išdavikas paleidžiamas, tuo tarpu neprisipažinęs nusikaltėlis sėda į kalėjimą 10 metų. Jei abu nusikaltėliai išduoda vienas kitą - abu sėda į kalėjimą 5 metams, jei abu tyli - kiekvienas (dėl įkalčių stokos) gauna tik po 1 metus.
Akivaizdu, jog geriausias rezultatas nusikaltėliams būtų abiems tylėti - ir gauti vos po 1 metus. Tačiau pažiūrėkime, kaip šį uždavinį jie sprendžia praktikoje, ir koks rezultatas (dėl to) labiausiai tikėtinas.
Aš, būdamas vienu iš nusikaltėlių, turiu du pasirinkimus - TYLĖTI ir IŠDUOTI - surašykime manęs laukiančius rezultatus į lentelę (kai mano draugas tyli ir kai meluoja atitinkamai):
TYLĖTI: 1M, 10M
IŠDUOTI: 0M, 5M
Nesunku matyti, jog jei mano draugas tyli, man geriau yra rinktis IŠDUOTI (0M vs 1M); jei mano draugas nusprendžia išduoti, man vėl geriau rinktis IŠDUOTI (5M vs 10M). Kadangi ABIEM ATVEJAIS mano rezultatas geresnis IŠDUODANT, mano racionalus pasirinkimas bus IŠDUOTI. Jei mano draugas mąstys kaip aš (t.y. bus racionalus žaidėjas), jis išduos mane - rezultate abu mes praleisime kalėjime po 5 metus. Nors mums abiem geriausias rezultatas būtų TYLĖTI, labiausiai tikėtinas rezultatas yra jog mes abu IŠDUOSIM (laikant, jog žaidimas žaidžiamas vieną kartą ir nei vienas iš mūsų neturime bijoti keršto).
Slapti skaičiai
Grįžkime prie lošimo kauliuko. Žaidimą žaidžia du žaidėjai. Žaidimo eiga: abu žaidėjai meta po 1 lošimo kauliuką - kiekvienas pažiūri iškritusių akučių skaičių, tačiau jo nerodo priešininkui; kiekvienas žaidėjas (nerodydamas savo pasirinkimo priešininkui) ant lapelio užrašo skaičių 0 arba 1; žaidėjai atskleidžia savo išmestų akučių skaičių ir laimėtoju tampa išmetęs didesnį skaičių; laimėtojo gautų taškų skaičius lygus žaidėjų užrašytų skaičių sumai. Žaidimas kartojamas ir jo tikslas yra surinkti daugiau taškų už varžovą.
Koks mūsu planas? Kadangi mes nevaldome nei išmetamo akučių skaičiaus, nei priešininko veiksmų, mūsų vienintelis sprendimas yra ką rašyti - 0 ar 1 - pamačius kiek akučių jau išmetėme. Tokiu būdu mūsų strategija yra funkcija, priklausoma nuo išmestų akučių skaičiaus (i.e. kiekvienam galimam akučių skaičiui turime priskirti skaičių 0 arba 1).
Toliau pastebėkime tai, jog rašydami 0 mažiname, o rašydami 1 - didiname, prizinį fondą, kurį gau laimėtojas. Tokiu būdu būtų racionalu stengtis didinti prizinį fondą tikintis laimėti, ir jį mažinti - tikintis, jog pralaimėsim. Kadangi nežinome, kiek akučių iškrito mūsų priešininkui, tegalime laikyti, jog kiekvienas iš 6 galimų skaičių vienodai tikėtinas. Jei taip, išmetę 1-2-3 mes dažniau pralaimėsim, nei laimėsim, tuo tarpu išmetę 4-5-6 - atvirkščiai. Tada mūsų optimali strategija yra rašyti 0, pamačius iškritusias 1-2-3 akutes - kitaip rašyti 1. Vėlgi, pavyzdys iliustruoja, kad optimalūs sprendimai egzistuoja ir nežinant visos informacijos (įskaitant žaidimo prieš kitą racionalų žaidėją atvejus).
Monetos mėtymas
Taigi, atėjo laikas man ištesėti savo pažadą. Binions suvenyrinių kortų kaladė iškeliaus pas vieną iš teisingai išsprendusių toliau mano siūlomą užduotį (su nugalėtoju susisieksiu, ir dėl pristatymo susitarsime). NERAŠYKITE SAVO ATSAKYMŲ KOMENTARUOSE - siųskite juos mano elektroniniu adresu iki spalio 31d. Rezultatus pranešiu :)
Žaidimą žaidžia du žaidėjai - A ir B. Žaidimo eiga: abu žaidėjai į puodą sudeda po 100 litų; kiekvienas žaidėjas meta po 1 monetą, tačiau rezultato (herbas ar skaičius) oponentui kol kas neparodo (tačiau pats pažiūri); žaidėjas A dabar gali pasirinkti - žiūrėti kas laimėjo arba į puodą įdėti dar 50 litų; jei jis į puodą įdeda dar 50 litų, žaidėjas B gali pasiduoti arba atsakyti tuo pačiu - irgi įdėti dar 50 litų į puodą; jei B pasiduoda, A gauna puodą; kitaip žaidėjai žiūri kas laimėjo, ir laimėtojas gauna puodą (herbas visada laimi prieš skaičių) - arba puodas dalijamas pusiau lygiųjų atveju. Žaidėjai žaidžia šį žaidimą 1 milijoną kartų, A pradeda kiekvieną kartą. Abu žaidžia optimaliai.
Užduotis: kuris žaidėjas laimės ir kiek? pateikite savo atsakymo paaiškinimą


0 komentarai (-ų):
Rašyti komentarą