6533b85bfe1ef96bd12baf1b
RESEARCH PRODUCT
Abstraktās nozīmes reprezentācijas atvasināšana no esošajiem sintaktiskajiem un semantiskajiem attēlojumiem Latviešu valodā
Rihards Sprukulissubject
DatorzinātneValodas resursiSemantiskā parsēšanaAbstraktā nozīmes reprezentācijaUniversālās atkarībasFreimu semantikadescription
Dabiskās valodas automatizētas sapratnes risinājumi ir aktuāli un tiek izmantoti ikdienā: liela apjoma teksta analīzē, informācijas izguvē un strukturēšanā, mediju un sociālo tīklu monitoringā u.c. Šo risinājumu implementācija balstās uz teksta semantiskajiem parsētājiem, kuru mašīnapmācībai nepieciešamas lielas, formāli anotētas datu kopas (valodas resursi). Viens no pēdējos gados plašāk pētītajiem teksta semantiskā attēlojuma formālismiem ir Abstraktā nozīmes reprezentācija (AMR). Latviešu valodai ir pieejami vairāki sintaktiski un semantiski anotēti valodas resursi, taču pašlaik vēl nav pieejama apjomīga, kvalitatīvi anotēta latviešu valodas AMR treniņdatu kopa. Iegūt AMR treniņdatus nav vienkārši – izmantot cilvēkresursus ir dārgi un laikietilpīgi, savukārt esošo angļu valodas AMR parsētāju precizitāte nav pietiekama, lai kvalitatīvu un konsekventu AMR attēlojumu automātiski projicētu latviešu valodas teikumiem, izmantojot mašīntulkošanu. Darba mērķis ir izstrādāt metodi un tās implementāciju AMR attēlojuma automātiskai atvasināšanai no esošiem zemāka līmeņa sintaktiski un semantiski anotētiem latviešu valodas resursiem. Darbā ir apskatīti dažādie attēlojumi, pētīti iespējami risinājumi, aprakstīta izvēlētā risinājuma implementācija, novērtēta iegūtā AMR attēlojuma kvalitāte un pārklājums.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2020-01-01 |