6533b7d9fe1ef96bd126d0c4

RESEARCH PRODUCT

Modelling latvian language for automatic speech recognition

Askars Salimbajevs

subject

DatorzinātnesComputer Science

description

Pēdējo gadu laikā runas atpazīšanas tehnoloģiju panākumi tādām valodām kā angļu valoda ir izraisījuši satraukumu un jaunu interesi. Šie panākumi ir mudinājuši daudzus izstrādātājus pievērsties runas tehnoloģijām savai dzimtajai valodai. Tomēr lielākā daļa pētījumu ir koncentrēti ap “lielajām” valodām, bet tādas valodas kā latviešu nav aptvertas. Šīs doktora disertācijas mērķis ir atrast efektīvas un optimālas metodes vispiemērotāko modeļu un sistēmu radīšanai latviešu valodas vispārīgai runas atpazīšanai. Darbā analizēti gan teorētiskie, gan praktiskie aspekti: akustisko un valodu modeļu izpēte, sistēmu pielāgošana īpašiem uzdevumiem, automātiska datu vākšana, apgrieztā teksta normalizācija (interpunkcijas atjaunošana) un praktisku sistēmu izstrāde. Uz vispārīgas jomas novērtēšanas kopas darbā izstrādāta sistēma sasniedz kļūdas īpatsvaru 10,1%, un ievērojami pārsniedz Google (36,2 –50,6%) un Speechmatics (25,2%) risinājumus latviešu valodai.

https://dspace.lu.lv/dspace/handle/7/46544