0000000000345679

AUTHOR

Askars Salimbajevs

Modelling latvian language for automatic speech recognition

Pēdējo gadu laikā runas atpazīšanas tehnoloģiju panākumi tādām valodām kā angļu valoda ir izraisījuši satraukumu un jaunu interesi. Šie panākumi ir mudinājuši daudzus izstrādātājus pievērsties runas tehnoloģijām savai dzimtajai valodai. Tomēr lielākā daļa pētījumu ir koncentrēti ap “lielajām” valodām, bet tādas valodas kā latviešu nav aptvertas. Šīs doktora disertācijas mērķis ir atrast efektīvas un optimālas metodes vispiemērotāko modeļu un sistēmu radīšanai latviešu valodas vispārīgai runas atpazīšanai. Darbā analizēti gan teorētiskie, gan praktiskie aspekti: akustisko un valodu modeļu izpēte, sistēmu pielāgošana īpašiem uzdevumiem, automātiska datu vākšana, apgrieztā teksta normalizācija…

research product

Using privacy-transformed speech in the automatic speech recognition acoustic model training

Automatic Speech Recognition (ASR) requires huge amounts of real user speech data to reach state-of-the-art performance. However, speech data conveys sensitive speaker attributes like identity that can be inferred and exploited for malicious purposes. Therefore, there is an interest in the collection of anonymized speech data that is processed by some voice conversion method. In this paper, we evaluate one of the voice conversion methods on Latvian speech data and also investigate if privacy-transformed data can be used to improve ASR acoustic models. Results show the effectiveness of voice conversion against state-of-the-art speaker verification models on Latvian speech and the effectivene…

research product

Inversās pastiprinājuma vadītas apmācīšanās metožu pielietojums intelektuālo aģentu izstrādē

Dota maģistra darba mērķis ir izpētīt inversās pastiprinājuma vadītas apmācīšanas metodi no intelektuālo aģentu izstrādes perspektīvas. Darba ietvaros tika izpētīti parastas pastiprinājuma vadītas apmācības teorētiskie pamati, inversās pastiprinājuma vadītas apmācības formulējums, motivācija, iespējamie risinājumi un konkrēti algoritmi. Iegūtās zināšanas tiek izmantotas darba praktiskajā daļā, kur autors izstrādājis un apmācījis intelektuālo aģentu, kas prot spēlēt Mario datorspēli. Konkrētāk, autors vairākas reizes nodemonstrēja aģentam, kā spēlēt Mario, un balstoties uz šīm demonstrācijām, aģents iemācījās to izpildīt. Mario aģenta izstrādes gaitā tika identificētas dažādas problēmas un g…

research product

Data Augmentation for Pipeline-Based Speech Translation

International audience; Pipeline-based speech translation methods may suffer from errors found in speech recognition system output. Therefore, it is crucial that machine translation systems are trained to be robust against such noise. In this paper, we propose two methods for parallel data augmentation for pipeline-based speech translation system development. The first method utilises a speech processing workflow to introduce errors and the second method generates commonly found suffix errors using a rule-based method. We show that the methods in combination allow significantly improving speech translation quality by 1.87 BLEU points over a baseline system.

research product

Universāls starpnieks datu glabāšanai mākonī

Dotā bakalaura darbā ir aprakstīts universāls starpnieks datu glabāšanai mākonī, kas palīdz risināt “piesaistes pie pakalpojumu sniedzēja”(“vendor lock-in”) problēmu. Starpnieks būtībā ir abstrakcijas slānis datu glabāšanas mākoņu pakalpojumiem, kas ļauj izstrādāt lietotnes, kuri nav atkarīgi no konkrētiem pakalpojumu sniedzējiem. Autors izpētīja dažādus datu glabāšanas pakalpojumus, to API un definēja universālu starpnieku datu glabāšanai mākonī, starpnieka protokolu, starpnieka augša līmeņa arhitektūru un uzdevumus. Lai pārbaudīt, ka starpnieks patiešam var risināt uzdoto problēmu, darba ietvaros tika izstrādātas starpnieka prototips un divas lietotnes, kas izmanto starpnieku lai piekļūtu…

research product

Monolingual and cross-lingual intent detection without training data in target languages

Due to recent DNN advancements, many NLP problems can be effectively solved using transformer-based models and supervised data. Unfortunately, such data is not available in some languages. This research is based on assumptions that (1) training data can be obtained by the machine translating it from another language

research product