6533b7d8fe1ef96bd126a7ef
RESEARCH PRODUCT
Papildu funkciju izstrāde mašīnmācīšanās teksta analizatoram
Mikus Kalniņšsubject
pythonCorExtēmu modelēšanaDatorzinātneteksta analīzemašīnmācīšanāsdescription
Teksta analīzes veikšanai ir pieejamas vairākas metodes, šajā dokumentā ir apskatīts kā pielietot Correlation Explanation[7] (korelāciju skaidrošana, turpmāk CorEx[7]) teksta analīzes metodi, implementējot atvērtā pirmkoda (open-source) bibliotēku corextopic[3], jau izstrādātā sistēmā - mašīnmācīšanās teksta analizatorā (turpmāk MMTA). Darbā ir aprakstīta MMTA pamatdarbība un tā mijiedarbība ar implementēto corextopic[3] bibliotēku. MMTA ir programmprodukts ar implementētām vairākām bibliotēkām, kas dod iespēju programmprodukta lietotājam izvēlēties starp vairākām datu apstrādes metodēm saistībā ar teksta analīzi. MMTA darbība iedalās. Informācijas ekstrakcija un tēmu modelēšana ir divi MMTA darbības iedalījumu piemēri. Darbā tiek apskatīta tēmu modelēšana, jo corextopic[3] bibliotēka sniedz bagātīgi modelētas tēmas, tā raksturojot apstrādājamo datu kopumu.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2019-01-01 |