0000000000415678

AUTHOR

Lauma Pretkalniņa

showing 3 related works from this author

Integrēta sistēma sintaktiski anotēta latviešu valodas teksta korpusa izveidei

2011

Darbā aplūkota sintaktiski anotētu korpusu (treebank) izstrādes problemātika ar mērķi radīt stabilu tehnoloģisko pamatu sintaktiski anotēta latviešu valodas korpusa izstrādei. Darbā apskatīti klasiskie sintaktiskās analīzes (reprezentācijas) modeļi — vārdkopu struktūru un atkarību gramatikas — un SemTi-Kamola hibrīdais gramatikas modelis valodām ar relatīvi brīvu vārdu secību. Darbā analizēta pasaulē lielāko sintaktiski anotēto korpusu pieredze un formāti, īpašu uzmanību pievēršot vadošā atkarību pieejā balstītā korpusa — Prāgas atkarību korpusa (Prague Dependency Treebank — PDT) — vairāklīmeņu anotāciju struktūrai. Darbā izstrādāts SemTi-Kamola gramatikas modeļa paplašinājums, kas nodrošin…

Datorzinātne
researchProduct

Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank

2018

The treebanks provided by the Universal Dependencies (UD) initiative are a state-of-the-art resource for cross-lingual and monolingual syntax-based linguistic studies, as well as for multilingual dependency parsing. Creating a UD treebank for a language helps further the UD initiative by providing an important dataset for research and natural language processing in that language. In this paper, we describe how we created a UD treebank for Latvian, and how we obtained both the basic and enhanced UD representations from the data in Latvian Treebank which is annotated according to a hybrid dependency-constituency grammar model. The hybrid model was inspired by Lucien Tesniere’s dependency gram…

060201 languages & linguisticsDependency (UML)GrammarComputer sciencebusiness.industrymedia_common.quotation_subjectTreebankLatvian06 humanities and the arts02 engineering and technologycomputer.software_genreSyntaxlanguage.human_languageDependency grammar0602 languages and literature0202 electrical engineering electronic engineering information engineeringlanguage020201 artificial intelligence & image processingArtificial intelligencebusinessRepresentation (mathematics)computerNatural language processingmedia_commonDe facto standard
researchProduct

Universāli apmācāms skaidrojošo vārdnīcu strukturālās marķēšanas rīks

2009

Darbā apskatīts jautājums, kā izstrādāt pielāgojamu programmnodrošinājumu latviešu valodas skaidrojošo vārdnīcu strukturālai marķēšanai, no vizuāla formatējuma iegūstot pēc iespējas precīzu šķirkļu struktūras atainojumu XML formātā, atbilstošu iepriekš dotai XML shēmai. Izstrādājamā rīka mērķis ir ļaut leksikogrāfam bez zināšanām datorikā, programmēšanā, tai skaitā regulārajās izteiksmēs, ar maksimāli vienkāršiem, intuitīviem līdzekļiem iegūt konkrētai, esošai vārdnīcai pielāgotu automātisku marķētāju. Darbā ir aprakstīti gan izstrādātie marķēšanas rīka darbības principi, gan realizētais prototips.

Datorzinātne
researchProduct