6533b7dafe1ef96bd126f001

RESEARCH PRODUCT

Lielo datu izaicinājumi

Dace Pētersone

subject

lielie datiizaicinājumidatu analīzeMatemātikaMonte Karlo Metodekļūdas

description

Lielos datus mēdz dēvēt par 21. gadsimta naftu. Gandrīz katrs uzņēmums cenšas izmantot datu piedāvātās iespējas, lai gūtu labumu, kā arī datu apjoms palīdz ievērojamu zinātnisku atklājumu veikšanā, tomēr nekorekta datu analīze rada riskus veikt kļūdainus secinājumus. Maģistra darba mērķis ir iepazīstināt lasītāju ar lielajiem datiem un to īpašībām, jo lielo datu raksturs ir atšķirīgs no ierasti mazajām izlasēm, uz kurām balstās tradicionālā statistika. Darba gaitā tika apkopotas potenciālo kļūdu piemēri, kuras analītiķis var pieļaut, analizējot lielo datus ar konvencionālajām statistikas metodēm, kuru pamatā ir daudzi pieņēmumi. Tika izveidota Monte Karlo metode lineārās regresijas koeficientu novērtēšanai pie liela datu apjoma, izmantojot paralēlo skaitļošanu. Modelis tika realizēts programmā R, izmantojot reālu datu piemērus.

https://dspace.lu.lv/dspace/handle/7/39929