6533b82afe1ef96bd128c6c7

RESEARCH PRODUCT

Inversās pastiprinājuma vadītas apmācīšanās metožu pielietojums intelektuālo aģentu izstrādē

Askars Salimbajevs

subject

Datorzinātne

description

Dota maģistra darba mērķis ir izpētīt inversās pastiprinājuma vadītas apmācīšanas metodi no intelektuālo aģentu izstrādes perspektīvas. Darba ietvaros tika izpētīti parastas pastiprinājuma vadītas apmācības teorētiskie pamati, inversās pastiprinājuma vadītas apmācības formulējums, motivācija, iespējamie risinājumi un konkrēti algoritmi. Iegūtās zināšanas tiek izmantotas darba praktiskajā daļā, kur autors izstrādājis un apmācījis intelektuālo aģentu, kas prot spēlēt Mario datorspēli. Konkrētāk, autors vairākas reizes nodemonstrēja aģentam, kā spēlēt Mario, un balstoties uz šīm demonstrācijām, aģents iemācījās to izpildīt. Mario aģenta izstrādes gaitā tika identificētas dažādas problēmas un grūtības, kuras parasti rodas, praktiski pielietojot inversās pastiprinājuma vadītas apmācīšanas algoritmus. Darba otra daļa ir veltīta autora piedāvātiem klasisko inversās pastiprinājuma vadītas apmācīšanas algoritmu uzlabojumiem, kas palīdz atrisināt vienu no šīm problēmām.

https://dspace.lu.lv/dspace/handle/7/17073