6533b83afe1ef96bd12a7e0a

RESEARCH PRODUCT

Mašīnmācīšanās uzdevumu risināšanai interaktīvās tekstuālās vidēs

Guntis Vilnis Strazds

subject

Datorzinātneinteraktīvas tekstuālas piedzīvojumu spēlesMeta­learningmašīnmācīšanāsArtificial Neural NetworksText Adventure Games

description

Interaktīvas tekstuālas piedzīvojumu spēles var izmantot, lai pārbaudītu mašīnmācīšanās aģentu spējas tikt galā ar dažādiem izaicinājumiem, kas saistīti ar dabiskās valodas izpratni, problēmu risināšanu un atbilžu meklēšanu, vai tādas darbības izvēles stratēģiju apgūšana, kas vispārinās uz iepriekš nesastaptām vidēm. TextWorld platforma ir šādiem pētījumiem domāts ietvars un palīgrīki, ar kuru palīdzību var darbināt daudzas iepriekšpublicētas teksta piedzīvojumu spēles, vai arī definēt un ģenerēt jaunas spēles, dažādās sarežģītības pakāpēs un gandrīz bezgalīgās variācijās. Šajā darbā aprakstīta tāda algoritmiska orākula (oracle) ieviešana, kas var veiksmīgi atrisināt spēles no 3 dažādām iepriekšpublicētām spēļu kopām TextWorld platformā, kā arī orākula izmantošana kā apmācības datu avotu eksperimentiem, lai pārbaudītu mašīnmācīšanās modeļa, kas balstīts uz GPT­2, spēju iemācīties atrisināt šīs spēles. Ir iegūti daudzsološi sākotnēji rezultāti, kas liek domāt, ka GPT­2 arhitektūra var iemācīties –vismaz daļēji– atdarināt orākula darbību. Apmācītā modeļa snieguma līmeņa atšķirības to parbaudot uz divām dažādām testa spēļu kopām rada dažus interesantus jautājumus par to, kādi faktori varētu veicināt tā spēju vai nespēju vispārināties uz iepriekš neredzētām spēļu vidēm, un norāda uz dažiem interesantiem virzieniem turpmākiem eksperimentiem.

https://dspace.lu.lv/dspace/handle/7/53900