6533b7d4fe1ef96bd12622b4

RESEARCH PRODUCT

Strukturētu datu iegūšana no tīmekļa un to apkopošana

Aivars Irmejs

subject

Datorzinātne

description

Internetā kopumā ir pieejams liels informācijas apjoms, taču bieži vien vajadzīgā informācija ir sadalīta starp vairākām vietnēm pat viena veida datiem, kas sarežģī informācijas meklēšanu un analīzi. Šo problēmu risina, veidojot informācijas sistēmas, kuras iegūst un apkopo tīmeklī publicētos datus. Datu iegūšanas procesu apgrūtina atšķirības starp dažādām tīmekļa vietnēm un veidiem, kādā tās strukturē datus, kā arī šo struktūru nenoteiktība un nepastāvība. Šajā darbā pētītas kopējās problēmas, kas rodas, veidojot informācijas sistēmu datu iegūšanai no tīmekļa, kā arī prezentēta autora izveidota sistēma, kas apkopo dažādās interneta vietnēs publicētus Lielbritānijas komerciālā rakstura nekustamā īpašuma sludinājumus kopējā datu bāzē, un demonstrētas metodes, ar kurām apskatītās problēmas risinātas izveidotajā sistēmā.

https://dspace.lu.lv/dspace/handle/7/15904