6533b854fe1ef96bd12aeb23

RESEARCH PRODUCT

Hibrīda mašīntulkošana, kombinējot vairāku mašīntulkošanas sistēmu rezultātus.

Matīss Rikters

subject

Software and Systems EngineeringDatorzinātnesComputer Science

description

Šis darbs pēta metodes un izstrādā rīkus, lai kombinētu tulkojumus no dažādām mašīntulkošanas (MT) sistēmām, uzlabojot kopējo tulkojuma kvalitāti. Tiek pētīta metožu piemērojamība mazajām, morfoloģiski bagātajām valodām, it īpaši latviešu un igauņu valodai. Analizētas esošās metodes un izstrādātas vairākas jaunas, kuras implementētas un novērtētas, izmantojot automātisko un cilvēka vērtēšanu. Radītas vairākas jaunas metodes, kas: sadala avotvalodas teikumu fragmentos un tos kombinē, izmantojot valodas modeli; kombinē neirontulkojumus, izmantojot neironu MT uzmanības sastatījumus; iteratīvi papildina apmācības datus ar vairākpakāpju tulkošanas pieeju. Galvenie rezultāti ir jaunu tulkojumu kvalitātes standartu sasniegušas angļu-igauņu MT sistēmas; metodes neironu MT uzmanības sastatījumu izmantošanai MT kombinēšanai un izpratnei; MT kombinēšanas sistēmas angļu-latviešu statistiskajām MT sistēmām. Atslēgvārdi: Mašīntulkošana, datorlingvistika

https://dx.doi.org/10.13140/rg.2.2.35784.47369