6533b7d6fe1ef96bd126606a

RESEARCH PRODUCT

Latviešu valodas automatizēta morfoloģiskā un sintaktiskā analīze

Pēteris Paikens

subject

Datorzinātne

description

Darbā tiek apskatītas pasaulē izmantotās morfoloģiskās un sintaktiskās analīzes metodes, izvērtējot to pielietojuma iespējas brīvu latviešu valodas tekstu automatizētai analīzei. Tiek detalizēti aprakstīts praktiski realizēts risinājums uz leksikona bāzētai morfoloģijas analīzei, kas var nodro ināt kvalitatīvu atpazīšanu 97 % no brīva latviešu valodas teksta vārdiem. Pārējo vārdu atpazīšanai ir izstrādāta metode, kas piekārto iespējamos analīzes variantus, balstoties uz vārda izskaņu, tādējādi ļaujot to efektīvi izmantot citos valodniecības rīkos kā robustu vārdu analīzes slāni. Darbā ir izvērtētas problēmas latviešu valodas sintaktiskajā analīzē, apskatītas dažas praksē realizētas metodes sintakses parsēšanai, un piedāvāti risinājumi tālākai sintaktiskās analīzes uzlabošanai, pārveidojot esošās latviešu valodas formālās gramatikas uz Head-driven Phrase Structure Grammar bāzētu gramatikas un parsēšanas metodoloģiju.

https://dspace.lu.lv/dspace/handle/7/19656