6533b853fe1ef96bd12acff2

RESEARCH PRODUCT

Liela apjoma datu kopu klasterēšanas algoritmi

Roberts Darģis

subject

daudzvalodu dokumentu vektoriālā reprezentācijaDatorzinātnedokumentu attāluma funkcijasdokumentu straumju klasterēšanaklasterēšanas rezultāta novērtēšanas metrikas

description

Mūsdienās, strauji pieaugot internetā pieejamajam informācijas apjomam, aktuāla tēma valodu tehnoloģiju jomā ir informācijas grupēšana (klasterēšana) pēc vienotiem principiem vieglākai informācijas uztveramībai un izkaisītas informācijas apjoma mazināšanai. Darbā "Liela apjoma datu kopu klasterēšanas algoritmi" teorētiskajā daļā izpētītas un apkopotas metodes dokumentu klasterēšanai ar mērķi atrast piemērotāko metodi vai metožu kopu daudzvalodu ziņu straumju klasterēšanai. Darbā arī pētītas un salīdzinātas dažādas klasterēšanas rezultāta novērtēšanas metrikas. Praktiskajā daļā izstrādāta un izvērtēta sistēma daudzvalodu ziņu straumju klasterēšanai, tā darbības rezultāti un turpmāki pētījuma virzieni apkopoti darba nobeigumā.

https://dspace.lu.lv/dspace/handle/7/32225