0000000000415678
AUTHOR
Lauma Pretkalniņa
showing 3 related works from this author
Integrēta sistēma sintaktiski anotēta latviešu valodas teksta korpusa izveidei
2011
Darbā aplūkota sintaktiski anotētu korpusu (treebank) izstrādes problemātika ar mērķi radīt stabilu tehnoloģisko pamatu sintaktiski anotēta latviešu valodas korpusa izstrādei. Darbā apskatīti klasiskie sintaktiskās analīzes (reprezentācijas) modeļi — vārdkopu struktūru un atkarību gramatikas — un SemTi-Kamola hibrīdais gramatikas modelis valodām ar relatīvi brīvu vārdu secību. Darbā analizēta pasaulē lielāko sintaktiski anotēto korpusu pieredze un formāti, īpašu uzmanību pievēršot vadošā atkarību pieejā balstītā korpusa — Prāgas atkarību korpusa (Prague Dependency Treebank — PDT) — vairāklīmeņu anotāciju struktūrai. Darbā izstrādāts SemTi-Kamola gramatikas modeļa paplašinājums, kas nodrošin…
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
2018
The treebanks provided by the Universal Dependencies (UD) initiative are a state-of-the-art resource for cross-lingual and monolingual syntax-based linguistic studies, as well as for multilingual dependency parsing. Creating a UD treebank for a language helps further the UD initiative by providing an important dataset for research and natural language processing in that language. In this paper, we describe how we created a UD treebank for Latvian, and how we obtained both the basic and enhanced UD representations from the data in Latvian Treebank which is annotated according to a hybrid dependency-constituency grammar model. The hybrid model was inspired by Lucien Tesniere’s dependency gram…
Universāli apmācāms skaidrojošo vārdnīcu strukturālās marķēšanas rīks
2009
Darbā apskatīts jautājums, kā izstrādāt pielāgojamu programmnodrošinājumu latviešu valodas skaidrojošo vārdnīcu strukturālai marķēšanai, no vizuāla formatējuma iegūstot pēc iespējas precīzu šķirkļu struktūras atainojumu XML formātā, atbilstošu iepriekš dotai XML shēmai. Izstrādājamā rīka mērķis ir ļaut leksikogrāfam bez zināšanām datorikā, programmēšanā, tai skaitā regulārajās izteiksmēs, ar maksimāli vienkāršiem, intuitīviem līdzekļiem iegūt konkrētai, esošai vārdnīcai pielāgotu automātisku marķētāju. Darbā ir aprakstīti gan izstrādātie marķēšanas rīka darbības principi, gan realizētais prototips.