Search results for "korpuss"

showing 10 items of 27 documents

Latviešu valodas korpusa izveide no emuāru tekstiem

2015

Latviešu valodas korpuss sastāv galvenokārt no periodikas un daiļliteratūras, kur lietotā valoda ir atšķirīga no ikdienā lietotās valodas. Emuāri lielākoties stilistiski ir tuvāki sarunvalodai, jo lielākā daļa to autoru nav profesionāli rakstnieki vai žurnālisti, tāpēc šāda materiāla valodas korpuss paver jaunas pētījumu iespējas gan lingvistiem, gan datorlingvistiem. Darba ietvaros izstrādāta sistēma emuāru tekstu izgūšanai un izveidots korpuss ar ~ 12 milj. teksta vienībām. Darba ietvaros veikta izgūto tekstu kvalitātes izvērtēšana, izmantojot vārdu pamatformu īpatsvaru no leksikona un valodas noteikšanu. Iegūtais materiāls tika sadalīts 4 kvalitātes grupās. Darba gaitā izgūtie teksti apk…

tekstu izgūšanaDatorzinātnekorpusstiešsaistes valodaemuāri
researchProduct

Ēšanas tvītu modelēšana ar mašīnmācīšanās metodēm

2020

Darbā tiek aprakstīta apstrāde un modelēšana konkrētai no mikroblogošanas vietnes Twitter iegūtai datu kopai, kura ir par pārtikas produktu un ēšanas/dzeršanas tematiku, izmantojot mašīnmācīšanās metodes. Darba sākumā tiek izpētīta iegūtā datu kopa un no tās tiek izveidots datu korpuss. Šis korpuss tiek izanalizēts dažādos šķērsgriezumos un publicēts publiski citiem interesentiem. Kā viens no mašīnmācīšanās modeļiem tiek izstrādāts sentimenta analizators, kurš nosaka tvīta noskaņojumu. Izstrādes procesā maksimālā efektivitāte bijusi, ka vairāk kā pusi no novērtēšanas datiem modelis ir spējis pareizi novērtēt, saliekot vairākus tvītu datu kopas kopā.

DatorzinātneanalīzeTwitterdatu korpussmašīnmācīšanās
researchProduct

Valodas modeļi latviešu runas atpazīšanas sistēmai

2015

Automātiskā runas atpazīšanas sistēma (no angļu valodas automatic speech recognition – ASR) ir tāda sistēma, kas cilvēka izrunātos vārdus pārvērš tekstā. Tās pamata divas sastāvdaļas ir akustiskais un valodas modelis. Darba mērķis ir detalizēti apskatīt metodes, ar kurām tiek trenēti valodas modeļi, kā arī pārbaudīt, kā labākās no tām darbojas latviešu runas atpazīšanā. Valodas modeļu trenēšanā tika izmantotas brīvi pieejamās rīkkopas KenLM un SRILM. Runas atpazīšanas eksperimentos, kuros tika izmantota brīvi pieejamā runas atpazīša- nas rīkkopa Kaldi, tika identificētas problēmas, kādas rodas, valodas modeļus pielietojot runas atpazīšanai klasiskā veidā. Modificējot klasisko pieeju, ar kur…

valodas modeliDatorzinātneautomātiskā runas atpazīšanas sistēmakorpussakustiskais modelisgludināšana
researchProduct

Kolokāciju variācijas lietvārda "vaccination" koronavīrusa korpusa sadaļās (Lielbritānija un Amerikas Savienotās Valstis)

2022

Koronavīrusa leksika ir ļoti aktuāla un pašreiz tiek aktīvi pielietota visās angļu valodā runājošajās zemēs. Attieksmi pret vakcināciju var noteikt analizējot tiešsaistes masu mediju tekstus. Šī darba mērķis ir noteikt lietvārda vaccination kolokācijas izvēlētajos koronavīrusa apakškorpusos, lai noteiktu kā vakcinācijas tēma tiek apspriesta tiešsaistes masu medijos. Teorētiskajā daļā tiek aplūkotas lingvistikas teorijas par galvenajām vārdšķirām un kolokācijām, kā arī jau publicētie pētījumi. Empīriskajā daļā tiek aprakstīts jauktas metodes pētījums, kurā iekļauta gan kvantitatīva, gan kvalitatīva koronavīrusa apakškorpusu analīze. Galvenie secinājumi ir tie, ka paustā attieksme pret vakcin…

korpusa analīzekolokācijaskoronavīrusa korpussattieksme pret vakcinācijuValodniecībavārdšķiras
researchProduct

Valoda: nozīme un forma. Nr. 12: Gramatika un valodas apguve

2021

Rakstu krājums ietver 15 rakstu par dažādiem gramatikas un valodas apguves jautājumiem sinhroniskā un diahroniskā aspektā. Valodas materiāla analīze galvenokārt balstās dažādu korpusu (latviešu, lietuviešu, angļu) pētījumos un tekstu interpretācijā (latviešu un gruzīnu valodas diahroniskā aprakstā). This volume covers 15 articles on different synchronic and diachronic issues in grammar and language acquisition. The research is mainly corpus- based (using various Latvian, Lithuanian, English corpora) and text-driven (the history of Latvian, Latin, and Georgian).

gramatikalanguage acquisitionverbvalodas apguvegrammarcorpuskorpuss:HUMANITIES and RELIGION::Languages and linguistics::Other languages::Baltic languages [Research Subject Categories]darbības vārds
researchProduct

Angļu-latviešu motokrosa terminu vārdnīcas modeļa izstrāde

2020

Sportā izmantojamā valoda ir interesanta un salīdzinoši maz izpētīta tēma, ir sastādītas vairākas ar sportu saistītas vārdnīcas, bet nevienas vārdnīcas attiecībā uz motokrosu un tajā biežāk izmantoto valodu. Pētījuma tēma ir saistīta ar šo jomu, jo tā ir maz pētīta un varētu būt potenciāli noderīga cilvēkiem šajā jomā. Pētījuma galvenais mērķis ir atklāt būtiskāko ar motokrosu saistīto leksiku, izpētīt un analizēt vārdnīcas lietotāju vajadzības un sastādīt nelielu specializētu angļu-latviešu valodas tiešsaistes vārdnīcas modeli. Izmantotā pētījuma metodes ir īstenotas ar lietotāju pētījuma palīdzību, korpusa izveidi un analīzi, lai nodrošinātu izmantotos terminus vārdnīcas modelī. Rezultāti…

Valodniecībamotokrosa terminoloģijaspecializētas vārdnīcaskorpusssporta terminoloģija
researchProduct

Sporta uztura terminoloģija

2016

Šī bakalaura darba tēma ir saistīta ar sporta uzturu un terminiem. Sakarā ar to, ka sporta uzturs attīstās, arvien vairāk un vairāk personas izmanto sporta uzturu un uztura bagātinātājus, tomēr termini šīs zinātnes jomas diskursā var radīt situāciju, ka persona nesaprot diskursa saturu. Šī pētījuma gaitā autors aplūko, kas ir sporta uzturs, un izpēta teorētisko informāciju par terminiem. Turpinājumā, autors veic kvantitatīvo un kvalitatīvo pētījumu, lai atrastu tipiskākos terminus sporta uztura diskursā, kā arī to, kā šie termini ir radīti. Šī pētījuma laikā tika konstatēts, ka "tauki" ir visizplatītākais termins sporta uzturā, un salikteņu darināšana ir visbiežāk sastopamā uztura terminu r…

sporta uztursValodniecībaTerminoloģijaterminikorpuss
researchProduct

Vārdu savienojumi ar jēdzienu Market darījumu angļu valodā

2015

Bakalaura darba tēma ir Vārdu savienojumi ar jēdzienu Market darījumu angļu valodā. Darba mērķis ir atrast un analizēt vārdu savienojumus ar jēdzienu market darījumu angļu valodā. Vārdu savienojumi tika meklēti izmantojot konkordance funkciju Britu Nacionālajā Korpusā, sadaļā tirdzniecības angļu valoda. Tālāk vārdu savienojumi tika analizēti pēc to definīcijām un sadalīti atbilstoši pēc to tipiem. Pētījuma rezultāti atklāja, ka vārdu savienojumi, lai gan šķiet viegli saprotami, jo katrs vārds atsevišķi ir labi zināms, tomēr lietojot citā kontekstā būtiski maina vārdu un to savienojumu nozīmi. Tādēļ ir svarīgi būt informētam par vārdu savienojumu nozīmi, lai varētu piedalīties diskusijās par…

Britu Nacionālais KorpusskonkordanceValodniecībamarketdarījumu angļu valodakorpuss
researchProduct

Ortogrāfisko kļūdu biežums izglītojamo lietišķajā angļu rakstu valodā

2015

Darba Ortogrāfisko kļūdu biežums izglītojamo lietišķajā angļu raktu valodā mērķis ir analizēt ortogrāfiskās kļūdas studentu esejās lietišķajā angļu rakstu valodā un izpētīt, kurš ortogrāfisko kļūdu veids ir visbiežāk sastopamais. Pētnieciskā darba pamatdoma ir izpētīt, kādas ortogrāfiskās kļūdas pieļauj Latvijas Universitātes studenti, kuri apgūst otru svešvalodu. Darba autore izveidoja korpusu no 59 studnetu esejām, kuras bija uzrakstītas lekcijas laikā, un veica kļūdu analīzi, kurā apskata ortogrāfiskās kļūdas un to veidus. Kļūdu analīze apliecina, ka studentu esejas lietišķajā angļu rakstu valodā satur ievērojamu ortogrāfisko kļūdu daudzumu, neskatoties uz to, ka studentiem ir atļauts iz…

Valodniecībaortogrāfiskās kļūdaskorpusskļūdu analīzelingvistiskais korpuss
researchProduct

Daudzvalodu kompetences loma angļu sintakses apguvē

2021

Daudzvalodība ir plaši izplatīts fenomens lielākajā daļā pasaules, tāpēc valodas apguvēja daudzvalodu kompetence ir svarīgs aspekts, ko ņemt vērā, valodas apguves laukā. Bakalaura darba mērķis ir izpētīt teikumu veidu lietojumu divos valodas apguves attīstības posmos un iepriekšējas valodu zināšanu ietekmi sintakses apguvē. Pētījuma metode ir uz tekstu korpusa balstīta gadījuma analīze, kurā izmantotas triju angļu filoloģijas studentu esejas angļu, norvēģu un latviešu valodā. Pētījuma rezultāti liecina, ka teikumu veidu lietojums dažādās valodās un studentu individuālās valodas apguves gaitā atšķiras, taču kopumā norāda uz priekšroku saliktu pakārtotu teikumu lietojumam un saliktu teikumu l…

sintakses apguveValodniecībavalodu apguvedaudzvalodībateikumu veidivalodas apguvēju korpuss
researchProduct