6533b855fe1ef96bd12b1658

RESEARCH PRODUCT

Runas izdalīšana audio ierakstos, izmantojot dziļo mašīnapmācību

Krišs Saulītis

subject

ProgrammatūraDatorzinātneAudio ierakstiDenseNetFSD50Kdziļā mašīnmācīšanās

description

Kvalifikācijas darbā tiek aprakstīta sistēma, tās prasības un realizācija. Šī sistēma sastāv no tīmekļa vietnes un mašīnmācīšanās modeļa, ar kura palīdzību ir iespējams izdalīt runas fragmentus augšupielādētajā audio failā. Šī sistēma satur arī datu kopas sagatavošanas moduli, ar kura palīdzību tiek apkopoti dati no FSD50K kopas, un tie tiek sagatavoti priekš jau iepriekš apmācīta DenseNet modeļa pielāgošanas un apmācības. Rezultātā tika apmācīti vairāki modeļi, no kuriem tika atlasīts labākais, kurš pēc tam tika savienots ar tīmekļa vietni, ar kuras palīdzību ir iespējams iesniegt failu runas izdalīšanas analīzei un apskatīt atgriezto rezultātu lietotājam vienkāršā veidā.

https://dspace.lu.lv/dspace/handle/7/53893