6533b7d8fe1ef96bd1269d73

RESEARCH PRODUCT

Latviešu valodas Twitter tekstu noskaņojuma analīze populāro uzņēmumu uztveres novērtēšanai

Alīna Govoruhina

subject

DatorzinātneTwitterELECTRALaBSEnoskaņojuma analīzeBERT

description

Bakalaura darba mērķis ir analizēt latviešu Twitter publikāciju noskaņojuma analīzi, izmantojot jaunākos sasniegumus dabiskās valodās apstrādē: transformeru modeļus. Ir izpētīts, kā apmācīšana ar tekstiem, kas tika apstrādāti ar dažādām metodēm, ietekmē multilingvālu BERT, ELECTRA un LaBSE klasifikatoru rezultātus. Noskaidrots labākais un piemērotākais modelis darbā ar latviešu tvītiem – LVBERT, apmācīts ar latviešu literāriem rakstiem. Labākais modelis tika izmantots, lai veidotu noskaņojuma un tvītu publicēšanas biežuma grafus laikā, ko var izmantot marketingā, lai noskaidrotu sabiedrības viedokli par kādu uzņēmumu Twitter sociālā tīklā. Piemērotākās teksta priekšapstrādes metodes darbā ar transformeru modeļiem bija atsauču uz lietotājiem un vietrāžu URL izmešana un pieturzīmju un lielo un mazo burtu saglabāšana. Pozitīvu ietekmi uzrādīja populāro nezināmo tekstvienību vai emocijzīmju pievienošana modeļa vārdnīcai. Bakalaura darbā iegūtos rezultātus iespējams izmantot latviešu un citu līdzīgu valodu apstrādē.

https://dspace.lu.lv/dspace/handle/7/60017