6533b7d0fe1ef96bd125a782
RESEARCH PRODUCT
Patronizējošu un nosodošu tekstu noteikšana(SemEval 2022 uzdevums)
Romijs Gabriels Zaķissubject
nosodoši tekstiDatorzinātnetransformatorimašīnmācīšanāsBERTSemEvaldescription
Darbā tiek apskatīta problēma par nosodošu tekstu noteikšanu, kas ir viens no SemEval 2022 izvirzītajiem uzdevumiem. Tiek apskatīti teksti angļu valodā uz jau gatavas un novērtētas datu kopas. Darba mērķis ir apskatīt iespējamus risinājumus un no izvēlētajiem izstrādāt programmu izmantojot dažādus valodas tehnoloģijas modeļus kuri spētu nolasīt doto datu kopu un atgriezt paredzējumu vai teksts ir nosodošs vai nav, kā arī apkopot informāciju par dažādiem sistēmas uzbūves slāņiem un to darbību. Galvenie modeļi, kuri darbā tiek apskatīti, realizēti un testēti ir BERT, RoBERTA un distilBERT, kā arī Naive Bayes modelis, kurš kalpo kā bāzlīnija salīdzināšanai. Beigās tiek iegūti rezultāti ar katra modeļa efektivitāti pēc to precīzumspējas, pārklājuma un precizitātes un veikti secinājumi par tiem, kā arī par to kā modeļus varētu uzlabot vai kādas nepilnības tajos bija. Atslēgvārdi: nosodoši teksti, BERT, mašīnmācīšanās, transformatori, SemEval, teksta klasifikācija, datu kopa
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2022-01-01 |