Vahvistusoppiminen pokerissa

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author
Location:
P1 Ark V80

Date

Major/Subject

Mcode

T-93

Degree programme

Language

fi

Pages

57

Series

Abstract

Pokeri on mielenkiintoinen tutkimuskohde tekoälylle. Pokerin saannot ovat yksinkertaiset ja helposti opittavat, mutta se on pelinä monimutkainen ja vaikeasti hallittava. Useissa muissa peleissä pelaajilla on mahdollisuus tietää pelin nykyinen tila, koska kaikki tarvittava informaatio on näkyvillä. Pokeri on tässä suhteessa erilainen, koska se on epätäydellisen informaation peli, jossa pelaaja joutuu tekemään monimutkaisia päätöksiä tuntematta pelin tilaa, koska vastustajan kortit eivät ole tiedossa. Parhaat ihmispelaajat voittavat helposti tämän hetken parhaimmat pokeria pelaavat tietokoneohjelmat. Näin ei ole useissa muissa peleissä, jotka perustuvat täydelliseen informaatioon, kuten tammipeli ja backgammon. Tämän hetken paras pokeria pelaava tietokoneohjelma perustuu peliteoriaan, jonka heikkous on kyvyttömyys oppia vastustajan virheistä. Työ keskittyy pokeripeliin, jota kutsutaan nimellä Split-Limit Texas Hold' em ja sen kahden pelaajan versioon. Vahvistusoppimista apuna käyttäen kehitettiin ohjelma, joka pelaa tätä kyseistä pokeripeliä. Ohjelma näyttää, että oppiminen on mahdollista itsensä kopiota vastaan pelatessa ja että se pystyy jatkamaan oppimista edelleen pelatessa muita vastustajia vastaan. Ohjelma voitti tämän hetken parhaan pokeriohjelman pienellä marginaalilla, saavutettuaan maksimaallisen suorituskyvyn vahvistusoppimista käyttäen.

Description

Supervisor

Syrjänen, Markku

Thesis advisor

Syrjänen, Markku

Keywords

Other note

Citation