6533b7d7fe1ef96bd1269352
RESEARCH PRODUCT
Automātiska teksta konspektēšana izmantojot jēdzientelpu
Reinholds Pīrāgssubject
ekstraktīva konspektēšanajēdzientelpaDatorzinātneword2vecTF-IDFdescription
Šobrīd pasaulē ir vērojams milzīgs informācijas daudzuma pieaugums un ir arvien grūtāk iepazīties ar šo informāciju. Automātiskas teksta konspektēšanas mērķis ir spēt pārveidot lielu tekstuālas informācijas daudzumu īsākā formātā, kurš spēj saglabāt oriģinālā teksta svarīgāko informāciju. Viena no metodēm kā automātiski konspektēt tekstu ir izvēlēties svarīgākos teikumus no teksta. Mērķis ir izvēlēties teikumus tā, lai tajos esošā informācija savstarpēji nepārklājas, kā arī nosedz pietiekamu daļu no konspektējamā teksta. Lai to izdarītu ir jāsalīdzina teikumu ietvertās informācijas līdzīgums. Jēdzientelpa ir moderns rīks, ar kura palīdzību var noteikt vārdu nozīmi un līdzību ar citiem vārdiem. Šajā darbā tiek izveidota sistēma, kura automātiski konspektē tekstu izmantojot jēdzientelpas vektorus, lai mērītu teikumu informācijas saturu. Pēc tam iegūtie rezultāti tiek salīdzināti ar tradicionālo TF-IDF metodi. Jēdzientelpas vektoru metodes rezultāti ir labi, bet tie ir nedaudz zemāki par tradicionālās TF-IDF metodes rezultāti.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2016-01-01 |