6533b86cfe1ef96bd12c85c0

RESEARCH PRODUCT

Teksta klasifikācijas metodes

Simona Klodža

subject

atbalsta vektoru mašīnaNaivā Beijesa metodeteksta analīzeMatemātikamašīnmācīšanās algoritmiteksta klasifikācija

description

Aizvien vairāk un vairāk cilvēkam ir pieejami teksta dokumenti elektroniskā formā - tiek sūtīti e-pasti, akadēmiskie žurnāli un publikācijas, un ieskenētas veidlapas. Kaut gan teksta dokumentus parasti manuāli klasificē pēc to atslēgas vārdiem vai atbilstības, mašīnmācīšanās algoritmi un automātiska tekstu klasificēšana ļauj ietaupīt daudz resursu - gan cilvēka stundas, gan līdzekļu. Lai iegūtu vērtīgu informāciju no šiem datiem, vispirms tos nepieciešams apstrādāt, un tad apmācīt pašu algoritmu. Šī darba ietvaros lasītājs tiek iepazīstināts ar teksta analīzes metodēm un mašīnmācīšanās algoritmiem, kas nodrošina automātisku teksta klasifikāciju. Kā arī var aplūkot to praktisko pielietojumu trīs dažādos teksta klasifikācijas uzdevumos.

https://dspace.lu.lv/dspace/handle/7/38922