6533b7d2fe1ef96bd125e570
RESEARCH PRODUCT
Rīku kopa latviešu valodas semantikas analīzei : publikāciju kopa
Pēteris Paikenssubject
informācijas izguveDatorzinātnesMorfoloģiskā un morfosintaktiskā analīzeDatoru un sistēmu programmatūraComputer sciencedescription
Promocijas darba pētījuma priekšmets ir automātiskas teksta analīzes metodes, apskatot visus dabiskās valodas apstrādes līmeņus, kas nepieciešami teksta semantiskai analīzei, īpaši pievēršoties risinājumiem, kuri trūka latviešu valodas teksta analīzei. Darbs ir izstrādāts 5 gadu laikā LU MII 4 pētījumu projektu un 2 valsts pētījumu programmu ietvaros. Darbā tiek aprakstītas autora realizētās metodes latviešu valodas nosaukto entitāšu atpazīšanai un piesaistei reālijām. Zināšanu formālās reprezentācijas vajadzībām ir izveidota FrameNet ontoloģija personu un organizāciju datu un attiecību modelēšanai. Darbā ir piedāvāts un realizēts latviešu valodas morfoloģiskās struktūras formāls modelis ar plašu pārklājumu, kas ir piemērots patvaļīga teksta analīzei. Darbā ir apskatītas autora realizētās metodes latviešu valodas morfosintaktiskajai analīzei un realizēts neironu tīklu risinājums daudznozīmības novēršanai. Izstrādātais modelis ir aprobēts praksē vairākos projektos un dabiskās valodas rīku izstrādē. Tāpat darbā ir piedāvāta un realizēta arhitektūra informācijas izguves rīku kopai. Pētīto metožu praktiskai aprobācijai darba gaitā ir izveidots informācijas izguves un zināšanu bāzes aizpildes sistēmas prototips faktu izguvei no latviešu valodas ziņu tekstiem. Šis prototips ir aprobēts ziņu aģentūrā LETA latviešu valodai, kā arī rezultāti ir novērtēti kontekstā ar labakajiem angļu valodas teksta analīzes rezultātiem. Atslēgas vārdi: Morfoloģiskā un morfosintaktiskā analīze, informācijas izguve
year | journal | country | edition | language |
---|---|---|---|---|
2018-01-01 |