6533b85ffe1ef96bd12c1fee
RESEARCH PRODUCT
Sekvenču līdzināšanas attēlojuma datņu saspiešanas rīka iespējamie uzlabojumi MPEG-G standartam
Andris Kārlis Straupenieks-brancissubject
SAM datnesDatorzinātneBezzudumu datu saspiešanaSekvenču līdzinājumiMPEG-Gdescription
Darba mērķis ir apskatīt datu saspiešanu genomisko datu datņu standartizācijas projektā MPEG-G, identificēt kādus uzlabojumus tajā iespējams veikt, un tos realizēt. Veikts literatūras apskats par MPEG-G standartu un bezzudumu datu saspiešanas algoritmiem. Identificēts, realizēts un profilēts iespējams uzlabojums. Viens no kandidātiem MPEG-G sekvenču līdzinājuma datņu saspiešanai – programma tsc izmanto datu saspiešanas bibliotēku zlib, kas savukārt izmanto DEFLATE datu saspiešanas algoritmu. Darbā apskatītas potenciālās alternatīvas zlib, viena no tām – zstd - ieviesta tsc, tās veikums profilēts un salīdzināts ar oriģinālās tsc versijas sniegumu. Izmainītā tsc versija iegūst vidēji 3% lielākas datnes ar 64% īsāku datu saspiešanas laiku un 4.6% īsāku datu dekodēšanas laiku.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2021-01-01 |