6533b823fe1ef96bd127fa59

RESEARCH PRODUCT

Latviešu valodas morfosintaktiskais marķētājs

Pēteris ŅIkiforovs

subject

Datorzinātnedatorlingvistikadabiskās valodas apstrādemorfosintaktiskā marķēšanamašīnmācīšanāslatviešu valoda

description

Bakalaura darbā aprakstīta morfoloģiskā marķētāja, kas izmanto vairāku klašu vidējo perceptrona mašīnmācīšanās algoritmu, izstrāde latviešu valodai. Darbā izstrādātajam marķētājam ir augsta precizitāte (95,20% un 94,32% - mērīta uz diviem dažādiem korpusiem), kas atbilst labākajiem rezultātiem pasaulē morfoloģiski sarežģītām valodām. Marķētājs salīdzināts ar diviem marķētājiem latviešu valodai, un tam ir labāka precizitāte nekā marķētājam, kas izmanto maksimālās entropijas modeli (94,83% un 91,51%), un nedaudz labāka precizitāte (93,67% un 93,6%) par marķētāju, kas izmanto nosacījumu Markova modeli.

https://dspace.lu.lv/dspace/handle/7/29536