6533b86ffe1ef96bd12ce1f2
RESEARCH PRODUCT
Vārdu nozīmju piekārtošana starp leksiskajiem tīkliem
Laine Strankalesubject
vārdlietojuma kartējumsDatorzinātneleksiskais tīklskuplināšanalatviešu valodadescription
Latvian WordNet ir latviešu valodas leksiskais tīkls – resurss, kurā vārdu nozīmes ir savienotas, balstoties uz to semantiskajām attieksmēm. Pašlaik tiek manuāli veidots pamattīkls, sasaistot ierobežotu skaitu vārdu nozīmju, taču teksta analīzei ir nepieciešams plašs pārklājums. Šī darba mērķis ir papildināt eksistējošo leksisko tīklu, automātiski piesaistot jaunas vārdu nozīmes un piekārtojot tās angļu valodas leksiskajam tīklam Princeton WordNet. Izvēlētā metode identificē angļu un latviešu valodām kopīgo informāciju, izmantojot latviešu skaidrojošās vārdnīcas Tēzaurs.lv un Princeton WordNet datus un salīdzinot ar vārdlietojuma kartējuma (angliski word embeddings) palīdzību nozīmju definīcijas, piemērus un sinonīmus. Rezultātā tika atrastas 54 924 nozīmes, ko var potenciāli pievienot Latvian WordNet, ar precizitāti 69% lietvārdiem, 40% darbības vārdiem, 70% īpašības vārdiem un 64% apstākļa vārdiem.
year | journal | country | edition | language |
---|---|---|---|---|
2021-01-01 |