0000000000345679

AUTHOR

Askars Salimbajevs

showing 6 related works from this author

Modelling latvian language for automatic speech recognition

2019

Pēdējo gadu laikā runas atpazīšanas tehnoloģiju panākumi tādām valodām kā angļu valoda ir izraisījuši satraukumu un jaunu interesi. Šie panākumi ir mudinājuši daudzus izstrādātājus pievērsties runas tehnoloģijām savai dzimtajai valodai. Tomēr lielākā daļa pētījumu ir koncentrēti ap “lielajām” valodām, bet tādas valodas kā latviešu nav aptvertas. Šīs doktora disertācijas mērķis ir atrast efektīvas un optimālas metodes vispiemērotāko modeļu un sistēmu radīšanai latviešu valodas vispārīgai runas atpazīšanai. Darbā analizēti gan teorētiskie, gan praktiskie aspekti: akustisko un valodu modeļu izpēte, sistēmu pielāgošana īpašiem uzdevumiem, automātiska datu vākšana, apgrieztā teksta normalizācija…

DatorzinātnesComputer Science
researchProduct

Using privacy-transformed speech in the automatic speech recognition acoustic model training

2020

Automatic Speech Recognition (ASR) requires huge amounts of real user speech data to reach state-of-the-art performance. However, speech data conveys sensitive speaker attributes like identity that can be inferred and exploited for malicious purposes. Therefore, there is an interest in the collection of anonymized speech data that is processed by some voice conversion method. In this paper, we evaluate one of the voice conversion methods on Latvian speech data and also investigate if privacy-transformed data can be used to improve ASR acoustic models. Results show the effectiveness of voice conversion against state-of-the-art speaker verification models on Latvian speech and the effectivene…

Speaker verificationevaluationvoice conversionComputer scienceSpeech recognitionautomatic speech recognitionLatvianAcoustic model[INFO.INFO-LG] Computer Science [cs]/Machine Learning [cs.LG]privacylanguage.human_language[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]anonymization[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG][INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]Identity (object-oriented programming)languageConversion methodautomatic speaker verification
researchProduct

Data Augmentation for Pipeline-Based Speech Translation

2020

International audience; Pipeline-based speech translation methods may suffer from errors found in speech recognition system output. Therefore, it is crucial that machine translation systems are trained to be robust against such noise. In this paper, we propose two methods for parallel data augmentation for pipeline-based speech translation system development. The first method utilises a speech processing workflow to introduce errors and the second method generates commonly found suffix errors using a rule-based method. We show that the methods in combination allow significantly improving speech translation quality by 1.87 BLEU points over a baseline system.

Machine translationComputer sciencePipeline (computing)media_common.quotation_subjectSpeech recognition[INFO.INFO-LG] Computer Science [cs]/Machine Learning [cs.LG]speech translationSpeech processingcomputer.software_genreneural machine translation[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]robustness to errorsWorkflow[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG][INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]Speech translationQuality (business)Noise (video)Suffixcomputermedia_commonHuman Language Technologies – The Baltic Perspective - Proceedings of the Ninth International Conference Baltic HLT 2020
researchProduct

Monolingual and cross-lingual intent detection without training data in target languages

2021

Due to recent DNN advancements, many NLP problems can be effectively solved using transformer-based models and supervised data. Unfortunately, such data is not available in some languages. This research is based on assumptions that (1) training data can be obtained by the machine translating it from another language

Machine translationTK7800-8360Computer Networks and CommunicationsComputer sciencePT languages0211 other engineering and technologies02 engineering and technologycomputer.software_genre[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]DEGermanFRLTLV0202 electrical engineering electronic engineering information engineeringEN DE FR LT LV PT languagesmonolingual and cross-lingual experimentsElectrical and Electronic Engineering021110 strategic defence & security studiesbusiness.industryCosine similarityLatvian020206 networking & telecommunicationsLithuanianEager learningword and sentence transformerslanguage.human_languageLazy learningHardware and ArchitectureControl and Systems EngineeringSignal ProcessinglanguageENArtificial intelligenceElectronicsbusinesscomputerSentenceNatural language processingBERT
researchProduct

Inversās pastiprinājuma vadītas apmācīšanās metožu pielietojums intelektuālo aģentu izstrādē

2013

Dota maģistra darba mērķis ir izpētīt inversās pastiprinājuma vadītas apmācīšanas metodi no intelektuālo aģentu izstrādes perspektīvas. Darba ietvaros tika izpētīti parastas pastiprinājuma vadītas apmācības teorētiskie pamati, inversās pastiprinājuma vadītas apmācības formulējums, motivācija, iespējamie risinājumi un konkrēti algoritmi. Iegūtās zināšanas tiek izmantotas darba praktiskajā daļā, kur autors izstrādājis un apmācījis intelektuālo aģentu, kas prot spēlēt Mario datorspēli. Konkrētāk, autors vairākas reizes nodemonstrēja aģentam, kā spēlēt Mario, un balstoties uz šīm demonstrācijām, aģents iemācījās to izpildīt. Mario aģenta izstrādes gaitā tika identificētas dažādas problēmas un g…

Datorzinātne
researchProduct

Universāls starpnieks datu glabāšanai mākonī

2011

Dotā bakalaura darbā ir aprakstīts universāls starpnieks datu glabāšanai mākonī, kas palīdz risināt “piesaistes pie pakalpojumu sniedzēja”(“vendor lock-in”) problēmu. Starpnieks būtībā ir abstrakcijas slānis datu glabāšanas mākoņu pakalpojumiem, kas ļauj izstrādāt lietotnes, kuri nav atkarīgi no konkrētiem pakalpojumu sniedzējiem. Autors izpētīja dažādus datu glabāšanas pakalpojumus, to API un definēja universālu starpnieku datu glabāšanai mākonī, starpnieka protokolu, starpnieka augša līmeņa arhitektūru un uzdevumus. Lai pārbaudīt, ka starpnieks patiešam var risināt uzdoto problēmu, darba ietvaros tika izstrādātas starpnieka prototips un divas lietotnes, kas izmanto starpnieku lai piekļūtu…

Datorzinātne
researchProduct