6533b85bfe1ef96bd12baf1b

RESEARCH PRODUCT

Abstraktās nozīmes reprezentācijas atvasināšana no esošajiem sintaktiskajiem un semantiskajiem attēlojumiem Latviešu valodā

Rihards Sprukulis

subject

DatorzinātneValodas resursiSemantiskā parsēšanaAbstraktā nozīmes reprezentācijaUniversālās atkarībasFreimu semantika

description

Dabiskās valodas automatizētas sapratnes risinājumi ir aktuāli un tiek izmantoti ikdienā: liela apjoma teksta analīzē, informācijas izguvē un strukturēšanā, mediju un sociālo tīklu monitoringā u.c. Šo risinājumu implementācija balstās uz teksta semantiskajiem parsētājiem, kuru mašīnapmācībai nepieciešamas lielas, formāli anotētas datu kopas (valodas resursi). Viens no pēdējos gados plašāk pētītajiem teksta semantiskā attēlojuma formālismiem ir Abstraktā nozīmes reprezentācija (AMR). Latviešu valodai ir pieejami vairāki sintaktiski un semantiski anotēti valodas resursi, taču pašlaik vēl nav pieejama apjomīga, kvalitatīvi anotēta latviešu valodas AMR treniņdatu kopa. Iegūt AMR treniņdatus nav vienkārši – izmantot cilvēkresursus ir dārgi un laikietilpīgi, savukārt esošo angļu valodas AMR parsētāju precizitāte nav pietiekama, lai kvalitatīvu un konsekventu AMR attēlojumu automātiski projicētu latviešu valodas teikumiem, izmantojot mašīntulkošanu. Darba mērķis ir izstrādāt metodi un tās implementāciju AMR attēlojuma automātiskai atvasināšanai no esošiem zemāka līmeņa sintaktiski un semantiski anotētiem latviešu valodas resursiem. Darbā ir apskatīti dažādie attēlojumi, pētīti iespējami risinājumi, aprakstīta izvēlētā risinājuma implementācija, novērtēta iegūtā AMR attēlojuma kvalitāte un pārklājums.

https://dspace.lu.lv/dspace/handle/7/50747