Search results for "datorlingvistika"

showing 5 items of 5 documents

Latviešu valodas izrunas datormodelēšana

2005

DatorlingvistikaLatviešu valoda - grafēmasLatviešu valoda - fonoloģijaLatvian language - phonologyComputational linguisticsLatviešu valoda - zilbes:HUMANITIES and RELIGION::Languages and linguistics::Other languages::Baltic languages [Research Subject Categories]Latviešu valoda - izrunas datormodelēšanaLatviešu valoda - fonēmasLatviešu valoda - fonētika
researchProduct

Latviešu valodas morfosintaktiskais marķētājs

2015

Bakalaura darbā aprakstīta morfoloģiskā marķētāja, kas izmanto vairāku klašu vidējo perceptrona mašīnmācīšanās algoritmu, izstrāde latviešu valodai. Darbā izstrādātajam marķētājam ir augsta precizitāte (95,20% un 94,32% - mērīta uz diviem dažādiem korpusiem), kas atbilst labākajiem rezultātiem pasaulē morfoloģiski sarežģītām valodām. Marķētājs salīdzināts ar diviem marķētājiem latviešu valodai, un tam ir labāka precizitāte nekā marķētājam, kas izmanto maksimālās entropijas modeli (94,83% un 91,51%), un nedaudz labāka precizitāte (93,67% un 93,6%) par marķētāju, kas izmanto nosacījumu Markova modeli.

Datorzinātnedatorlingvistikadabiskās valodas apstrādemorfosintaktiskā marķēšanamašīnmācīšanāslatviešu valoda
researchProduct

Baltu filoloģija, 8

1999

Salīdzināmā valodniecībaDatorlingvistikaLanguage contactsLatviešu valodaRudzīte Marta (publikācijas)Latviešu valodas gramatikaLatviešu valodas dialektoloģijaValodu kontakti:HUMANITIES and RELIGION::Languages and linguistics::Other languages::Baltic languages [Research Subject Categories]Baltu valodasLatvian language
researchProduct

Mašīntulkošanas korpusu tīrītāja rīka izstrāde

2015

Darbs „Mašīntulkošanas korpusu tīrītāja rīka izstrāde” apraksta programmas izstrādi, kas ļauj filtrēt un apstrādāt paralēlu vai neparalēlu korpusa tekstu, vadoties pēc kvantificējamiem un kvalitatīviem kritērijiem. Tie iekļauj noteiktu daudzumu filtrējošu un tīrošu funkciju.

mašīntulkošanaDatorzinātnedatorlingvistikakorpusskorpusa tīrīšana
researchProduct

Mašīnmācīšanās metožu lietojums vārdu sastatīšanā balstītai paralēlo korpusu novērtēšanai un tīrīšanai

2017

Šajā darbā ir aprakstīta paralēlu korpusu novērtēšanas un tīrīšanas metode, kas automātiski spēj noteikt katra teikuma derīgumu pēc to vārdu sastatījumiem ar paralēlo teikumu. Vārdu sastatījumi teikumā apraksta vārdu atbilstību ar to pašu teikumu iztulkotu citā valodā. Ja tie ir daudz attiecībā pret vārdu daudzumu, tad var pieņemt, ka teikumi ir atbilstīgi. Pazīmju analīzei tiek izmantots mašīnmācīšanās algoritms, kas spēj uzbūvēt laba/slikta teikuma raksturojošu pazīmju modeli. Paralēlu tekstu korpusi ir plaši pielietoti mašīntulkošanas sistēmu izveidē. Tādējādi darbā izvirzīta hipotēze, ka sastatījumos balstīta korpusa novērtēšana un tīrīšana palīdz atbrīvoties no neprecīziem tulkojumiem …

mašīntulkošanaDatorzinātnedatorlingvistikavārdu sastatījumimašīnmācīšanāskorpuss
researchProduct