Laak-Eslami Tiim väljus võitjana Inimene-Masin vahelisest pokkerivõistlusest

Laak-Eslami Tiim väljus võitjana Inimene-Masin vahelisest pokkerivõistlusest 0001

Pokkeriprofid Phil Laak ja Ali Eslami võitsid Polarise – nimelist, pokkerit mängivat arvutiprogrammi, pokkerivõistluses „Inimene Masina Vastu". Kahepäevane, neljaosaline matš leidis aset Vancouveris (Kanada) iga-aastasel Tehisintelligentsi Arengu Ühenduse koosolekul. Polaris edestas inimtiimi mõlemal esmaspäevasel osavõistlusel, kuid esimesel sessioonil oli edu niivõrd väike, et see loeti „statistiliseks viigiks". Seevastu teisipäeval suutsid Laak-Eslami Polarist mõlemas sessioonis lüüa.

Polaris loodi Alberta Ülikooli Arvutipokkeri Uuringute Grupi (CPRG) poolt. Grupi eestvedaja Jonathan Schaeffer on Alberta Ülikooli Arvutiteaduste Osakonna juhataja. Mul oli võimalus rääkida professor Shaeffer`iga teisipäeva pealelõunal, just enne kolmanda sessiooni lõppu. Küsisin temalt, mida tähendab matši tulemus CPRG-le. „Kui me kaotame, lakume oma haavu ja läheme tagasi oma töölaua äärde, et arendada välja uus ja parem tehnoloogia," vastas Shaeffer. „Kui me aga võidame, analüüsime matše toimunu paremaks mõistmiseks." Ta lisas, et isegi kui Polaris peaks Laak - Eslami`t võitma, „on tegemist suhteliselt vähese mängitud käte arvuga, mis tingimata ei pruugi olla inimesele eeliseks." Ta selgitas, et antud tingimuste puhul on ta kindel, et mõningad mängijad võiksid esineda programmi vastu palju efektiivsemalt.

Mainisin Shaeffer`ile praegusi vastuolusid internetipokkeris ja „pokkerirobotite" kasutamist. „Ma soovin väljenduda selgelt", ütles ta. „Me ei mängi netipokkerit. Ükski meie tarkvara pole võimeline mängima netipokkerit ühelgi saidil." Samuti teatas ta, et ükski Pokkeriakadeemia tarkvaradest, mis sisaldab tema grupi uurimusi, ei ole samuti ette nähtud online`is mängimiseks.

Pigem – nagu on selgitatud matši veebilehel – mängud „ on suurepärane valdkond tehisintelligentsi (TI) uurijaile kuna mängudel on hästi selgitatud reeglid ja selged eesmärgid." Kuna pokker „ sisaldab ebaselgust", tekitab see eriliselt „huvitava uurimusliku väljakutse". Samal põhjusel on pokker eriti mahlakas mäng uurijaile kuna ebaselgus on samuti „üleüldine realistlikus maailmas, mille lahendamiseks TI tehnika on ette nähtud."

Matš

Iga sessioon sisaldas 500 kätt „dubleeritud" limit Holdem`i $5/$10 blind`ide ja $10/$20 limiidiga. Esimene sessioon algas 23. juuli pealelõunal. Eslami võttis Polarise ette elava auditooriumi ees, tema mäng projitseeriti kõigile vaatamiseks laiekraanile. Samal ajal mängis Laak kusagil Hyatt Regency Hotelli privaattoas. Kaardid, mis jagati Eslami`le lahtises toas, olid samad mis jagati Polarisele ülakorrusel, samas kui Polarise lahtise toa kaardid olid samad Laak`ile nähtavatega. Ühenduskaardid olid samuti identsed.

Eslami esialgne kokkupõrge Polarisega oli väga hüplik. Sessiooni keskel oli ta arvutist ees üle $800, seejärel haihtus kogu ta edu järgmise paarisaja käe jooksul. Finišispurt võimaldas tal lõpetada sessiooni + $395. Samal ajal koges Laak Polarise vastu kohutavat starti, leides end juba $1500 taga olevat enne kui 200 kätt oli mängitud. Huvitav, et võrreldes nende kahe mängija tulemusi samade kaartidega, oli Eslami suutnud kasvatada edu vaid poole sellest, mis Polaris sessiooni selles staadiumis. Laak suutis siiski teha hilise „comeback`i" ja lõpetas 500 käe läbimängimise - $465 peal.

Kui need kaks sessiooni kokku liideti, oli Polarise edu inimeste ees $70 ehk seitse väikest panust. Ette oli otsustatud, et matši võitmiseks tuleb vastasvõistkonda edestada vähemalt 25 väikese panuselise ($250) vahega, muidu tunnistatakse matš statistiliselt viikiläinuks. Laak ja Eslami jagasid viigi eest saadud auhinnaraha $2500 kahevahel. Tulemus: Laak-Eslami 0, Polaris 0, ühe viigi juures.

Esmaspäeva õhtusel sessioonil nähti Laak`i istet võtmas lahtises toas samal ajal kui Eslami suundus ülakorrusele. Teine sessioon meelitas ligi hulga publikut - üle saja pealtvaataja (nende seas Laak`i väljavalitu, Jennifer Tilly) jälgis Phil`i mängu ja tema juhuslikke meelelahutuslikke kommentaare nagu „Polaris, sa ajad mind oksele."

Laak alustas tugevalt, kasvatades edu Polarise ees, mille ta säilitas kogu matši vältel. Käsi nr. 198, Laak`i käsi {9-Spades}{10-Spades} samal ajal Polarisel {q-Diamonds}{10-Hearts} . Polaris tõstis, Laak maksis ning flop tuli {9-Diamonds}{10-Clubs}{5-Hearts}. Mõlemad checkisid. Turn oli {8-Clubs} ja Laak panustas, misjärel Polaris tõstis. Laak maksis. River oli [2s} ja Laak check – maksis ning võitis $80 poti. Laak jätkas ühtlaselt oma edu kasvatamist, lõpetades $1560 algseisust ülalpool.

Paraku polnud Eslamil nii hästi läinud ning Polarisel oli õnnestunud Laak`i kaartidega võita temalt $2515. Näitena olgu toodud sama käsi nr.198 kus Polaris suutis üles korjata veelgi enam panuseid (ta tõstis ise enne floppi, panustas flopi ja check-tõstis riveris). Suur 95,5 panuseline edu tähendas Polarise võitu teises sessioonis. Skoor: Polaris 1,5 Laak-Eslami 0,5.

Laak ja Eslami said endale käte kirjeldused, et enne kahte viimast otsustavat sessiooni tutvuda toimunuga. Laak lahtises toas oli peamiselt viigiseisus Polarisega peale 250 kätt, omades pelgalt $30 edu. Hea kaardijooks seejärel võimaldas tal aga kasvatada $1800 edu 425. käeks ning lõpptulemuseks sessioonil kujunes + $1415. Oodati teise toa tulemusi, ent lühiajaline segadus põhjustas ühe käe tühistamise ja Laak`i tulemus paranes veel $40 võrra. Lõpuks Eslami saabus ja teatati, et ta kaotas Polarisele vaid $635, mis tähendas, et inimtiim oli kokkuvõttes saavutanud 82 väikese panuse võrra parema tulemuse kui programm. Sessiooni võit andis ühtlasi ka $5000 auhinnaraha. Skoor: Polaris1,5, Laak-Eslami 1,5.

Laak`i ja Eslami võit lisas ekstra dramaatikat teisipäeva õhtusele finaalsessioonile, kuna selle tulemus oleks nüüd otsustanud matsi üldvõitja. Pärast õhtusööki ja matšieelse strateegia arutelu, siirdusid mängijad heitlema Polarisega viimast korda. "See on nii ühendav", ütles Laak. "Ma pole kunagi varem enne pokkerimatši meeskonnakogunemisel viibinud."

Eslami pöördus tagasi avlikku tuppa ja sai kohe hea stardi, saades pihta üheksakolmikule Polarise JJ vastu. Sada kätt hiljem oli ta vaatamata sellele $255 defitsiidis. Matši edenedes selgitas Eslami pealtvaatajaskonnale mõningaid omi mõtteid sellest kuidas programm mängib, samuti kui väsitav on mängida sellise järeleandmatu vastasega. Eslami võitles tagasi juhtpositsiooni 225.-ks käeks ja 325.-ks oli ta edu juba $895. Ta hoidis juhtpositsiooni lõpuni ning $460 Polarisest ees. Peagi tuli ka Laak kinnisest toast ja teatas, et suutis samuti $110 plussi jääda, mis tähendas, et inimesed olid üheskoos koguda suutnud $570 rohkem kui nende vastane arvuti. Paar sai teistkordselt $5000 puhastulu sessiooni võidu eest. Lõplik seis: Laak-Eslami 2,5, Polaris 1,5.

Uuringud jätkuvad

Nagu Shaeffer oli eelnevalt alla kriipsutanud suhtelise vähetähtsuse 2000 dubleeritud käe näite puhul, rõhutas ka Eslami pärastpoole " see ei olnud võit." Tõepoolest, üle 4000 mängitud käe järel, lõpetasid inimesed vaid väikese ($365 ehk 36,5 väikest panust) ühise edumaaga.

Sellegipoolest andis see matš Scaeffer`ile ja CPRG-le tohutult uut informatsiooni, mille najal oma uurimistööd jätkata. Eelmisel nädalal reporteerisid nad, et pärast pea kaks aastakümmet kestnud uurimusi "lahendasid" nad lõpuks kabemängu, luues põhimõtteliselt võitmatu programmi, mis valib alati parima võimaliku käigu. Ma küsisin Schaeffer`ilt kas CPRG loodab sarnaselt "lahendada" ka pokkeri. "Ühel päeval – 5-10 aasta jooksul – saab üks-ühe vastu limit Holdem lahendatud", rääkis Shaeffer mulle.

"Me jätkame tööd selle kallal," lisas ta. "Pokker on vahva."

Täismahus blogi kõigi nelja sessiooni kohta võib leida Alberta Ülikooli veebilehelt (cs.ualberta.ca), kus avalikustatakse ka täielik käte ajalugu.

VEEL LUGUSID

Mida Sa arvad?