6533b820fe1ef96bd1279eec

RESEARCH PRODUCT

Dzimtes stereotipu mazināšana mašīntulkošanā: mērķvalodas gramatiskās dzimtes projekcijas avotvalodā

Artūrs Stafanovičs

subject

gramatiskā dzimteDatorzinātnedzimumu aizspriedumiNMTdzimumu stereotipi

description

Tulkojot “The secretary asked for details.” no valodas bez gramatiskās dzimtes (angļu) uz valodu ar gramatisko dzimti (piemēram, latviešu), nepieciešams noteikt subjekta “the secretary” dzimumu. Ja teikuma līmenī nav nepieciešamās informācijas, to ne vienmēr ir iespējams izdarīt. Šādos gadījumos mašīntulkošanas sistēmas izvēlās biežāk sastopamos un līdz ar to dzimtes stereotipiem atbilstošos tulkojumu variantus (t.i. “sekretāre”). Darbā tiek piedāvāta mašīntulkošanas sistēmu apmācības metode, kur avotvalodas vārdiem ir tieši norādīta dzimtes pazīme (sieviešu vai vīriešu). Sistēmu apmācības dati tiek sagatavoti, projicējot mērķvalodas vārdu gramatiskās dzimtes uz avotvalodas vārdiem. Rezultāti uzrāda uzlabojumus tulkošanas kvalitātē līdz 4,6 BLEU punktiem un mazina sistēmu paļaušanos uz dzimumu stereotipiem, uzlabojot akurātumu līdz 32,9% WinoMT uzdevumā.

https://dspace.lu.lv/dspace/handle/7/50789