6533b85ffe1ef96bd12c1fee

RESEARCH PRODUCT

Sekvenču līdzināšanas attēlojuma datņu saspiešanas rīka iespējamie uzlabojumi MPEG-G standartam

Andris Kārlis Straupenieks-brancis

subject

SAM datnesDatorzinātneBezzudumu datu saspiešanaSekvenču līdzinājumiMPEG-G

description

Darba mērķis ir apskatīt datu saspiešanu genomisko datu datņu standartizācijas projektā MPEG-G, identificēt kādus uzlabojumus tajā iespējams veikt, un tos realizēt. Veikts literatūras apskats par MPEG-G standartu un bezzudumu datu saspiešanas algoritmiem. Identificēts, realizēts un profilēts iespējams uzlabojums. Viens no kandidātiem MPEG-G sekvenču līdzinājuma datņu saspiešanai – programma tsc izmanto datu saspiešanas bibliotēku zlib, kas savukārt izmanto DEFLATE datu saspiešanas algoritmu. Darbā apskatītas potenciālās alternatīvas zlib, viena no tām – zstd - ieviesta tsc, tās veikums profilēts un salīdzināts ar oriģinālās tsc versijas sniegumu. Izmainītā tsc versija iegūst vidēji 3% lielākas datnes ar 64% īsāku datu saspiešanas laiku un 4.6% īsāku datu dekodēšanas laiku.

https://dspace.lu.lv/dspace/handle/7/55811