Search results for "valodas"
showing 10 items of 566 documents
Abstraktās nozīmes reprezentācijas atvasināšana no esošajiem sintaktiskajiem un semantiskajiem attēlojumiem Latviešu valodā
2020
Dabiskās valodas automatizētas sapratnes risinājumi ir aktuāli un tiek izmantoti ikdienā: liela apjoma teksta analīzē, informācijas izguvē un strukturēšanā, mediju un sociālo tīklu monitoringā u.c. Šo risinājumu implementācija balstās uz teksta semantiskajiem parsētājiem, kuru mašīnapmācībai nepieciešamas lielas, formāli anotētas datu kopas (valodas resursi). Viens no pēdējos gados plašāk pētītajiem teksta semantiskā attēlojuma formālismiem ir Abstraktā nozīmes reprezentācija (AMR). Latviešu valodai ir pieejami vairāki sintaktiski un semantiski anotēti valodas resursi, taču pašlaik vēl nav pieejama apjomīga, kvalitatīvi anotēta latviešu valodas AMR treniņdatu kopa. Iegūt AMR treniņdatus nav…
Datora ģenerēta dzeja
2022
Pēdējos gados ir bijuši vairāki mēģinājumi ar datora palīdzību automātiski ģenerēt arī ko radošu – vizuālās mākslas radīšana, radoša teksta ģenerēšana vai pat mūzikas skaņdarbu komponēšana – šīs ir tikai dažas no jomām, ar kurām darbojas mākslīgais intelekts. Dabiskās valodas ģenerēšana ir visai daudzsološa mākslīgā intelekta un datorlingvistikas apakšnozare, kuras galvenais mērķis ir izstrādāt datorprogrammas, kas spēj radīt cilvēkiem uztveramu tekstu. Starp automātiski ģenerētajiem teksta veidiem var atrast pat dažādas laika prognozes, biogrāfijas, kā arī tekstus, kas ietver sevī radošumu – dažādus stāstus, jokus vai dzeju. Automātiskā dzejas ģenerēšana ir šķietami sarežģīts uzdevums un ļ…
Dabiskās Valodas Dziļo Neironu Tīklu Ģeneratora GPT-2 Sniegums Latviešu un Angļu Valodā
2021
Darbs ir veltīts dabiskās valodas apstrādes tēmas un modeļa GPT-2 izpētei un tā snieguma novērtēšanai angļu valodā, kā arī pielāgota valodas modeļa realizēšanai un apmācībai tekstu ģenerēšanai arī latviešu valodā. GPT-2 ir liels dabiskās valodas apstrādes modelis, kas ir paplašināts no GPT modeļa, daudzkārt palielinot modeļa parametru skaitu un apmācot to uz vairāk treniņa datiem. GPT-2 modeļa apmācībai izmantots valodas korpuss no interneta mājaslapu tekstiem, atšķirībā no GPT modeļa, kura apmācībai izmantots valodas korpuss no grāmatu tekstiem. Šis modelis ir radīts ar mērķi paredzēt nākamo vārdu, ņemot vērā iepriekš esošos vārdus konkrētā tekstā. Apstrādājot iepriekš dotu tekstu, ar GPT-…
Pēc loģikas līdzīgu teikumu meklēšana, izmantojot mašīnmācīšanās metodes
2018
Mūsdienās ļoti strauji pieaug mašīnmācīšanās popularitāte, kas rezultējas ar dažādu metožu izveidi valodas apstrādes jomā, bet lielākā daļa no šīm metodēm tiek izstrādātas priekš angļu valodas. Darbā tika izvirzīts mērķis aplūkot un salīdzināt populārākās metodes, kas ļauj salīdzināt teikumus pēc to loģikas un pārbaudīt tās uz latviešu valoda, lai gūtu priekšstatu par to, kuras no tām ir efektīvākas. Darba ietvaros tika pētītas mašīnmācīšanās dabiskās valodas apstrādes (NLP) metodes, kas ļauj iemācīt datoram saprast teikumu loģiku. Tika sagatavota apmācāmo datu kopa, kas satur teikumus latviešu valodā. Daļa no aplūkotajiem risinājumi tika izmēģināti, izmantojot sagatavoto apmācāmo datu kopu…
Latviešu valodas morfosintaktiskais marķētājs
2015
Bakalaura darbā aprakstīta morfoloģiskā marķētāja, kas izmanto vairāku klašu vidējo perceptrona mašīnmācīšanās algoritmu, izstrāde latviešu valodai. Darbā izstrādātajam marķētājam ir augsta precizitāte (95,20% un 94,32% - mērīta uz diviem dažādiem korpusiem), kas atbilst labākajiem rezultātiem pasaulē morfoloģiski sarežģītām valodām. Marķētājs salīdzināts ar diviem marķētājiem latviešu valodai, un tam ir labāka precizitāte nekā marķētājam, kas izmanto maksimālās entropijas modeli (94,83% un 91,51%), un nedaudz labāka precizitāte (93,67% un 93,6%) par marķētāju, kas izmanto nosacījumu Markova modeli.
Hokeja pirmsspēles apskata automātiska veidošana
2015
Hokeja pirmsspēles apskats, parasti ir ekspertu veidots rakstisks komandu salīdzinājums, kas balstās uz iepriekšējo spēļu statistiku un aktuālāko informāciju. Darbā aprakstīti būtiskākie aspekti automātiska pirmsspēles apraksta ģenerēšanā. Mērķis izveidot sistēmu, kas spēj izveidot saturīgus NHL pirmsspēles aprakstus. Darba rezultātā tika izveidota vienkārša sistēma, kas automātiski ievāc statistiku no NHL mājaslapas un spēj izveidot vienkāršus pirmsspēles apskatus.
Kontrolētas latviešu valodas izmantošana datu bāzu vaicājumu ģenerēšanā
2015
Viens no tehnoloģiju uzdevumiem ir darīt cilvēku ikdienas dzīvi vieglāku un ērtāku. Informācijas meklēšana, gan Internetā, gan citur pieejamos resursos, ir neatņemams ikdienas uzdevums. Pētot kā informācijas meklēšanas tehnoloģijas padarīt lietotājam ērtākas un intuitīvāk lietojamas, darba autore pievērsa uzmanību dabiskās valodas izmantošanai datu krātuvju saskarnēs. Dati Internetā tiek glabāti dažādos formāts, piemēram, relāciju datu bāzēs, no kurām tos iegūst ar SQL vaicājumiem, un RDF formātā, kas sastopams Semantiskajā tīmeklī. Darba izstrādē izmantoti LU MII izstrādātie rīki darbam ar ontoloģijām, tādi kā OWLGrEd grafiskais redaktors ar nepieciešamajiem spraudņiem. Dabiskās valodas ap…
Metamodel-based transformation-driven graphical tool building platform
2009
Pēdējo gadu laikā programmatūras izstrādē arvien lielāku popularitāti gūst modeļu balstītā pieeja (MDSD – Model Driven Software Development). MDSD tehnoloģijas pamatideja ir balstīt visu programmatūras izstrādes procesu uz katrai izstrādes fāzei atbilstošiem specializētiem modeļiem. Šie modeļi ne tikai dokumentē dažādus sistēmas aspektus, bet arī kļūst par tiešu programmatūras sastāvdaļu. Mūsdienu praksē MDSD modeļu aprakstam bieži izmanto specializētas modelēšanas valodas, sauktas par domēna (priekšmeta apgabala jeb lietojumsfēras) specifiskajām valodām (DSL – Domain Specific Language). Šīs valodas ļauj uzskatāmāk un efektīvāk aprakstīt kāda specifiska problēmas apgabala modeļus, izmantojo…
11. klases skolēnu valodas kompetences attīstīšana latviešu valodas paveidiem veltītajās stundās
2017
Diplomdarbā 11. klases skolēnu valodas kompetences attīstīšana latviešu valodas paveidiem veltītajās stundās izvirzīts mērķis attīstīt 11. klases skolēnu valodas kompetenci, izmantojot dialektoloģijas jautājumu un latgaliešu rakstu valodas nozīmes izpratnes sekmēšanai paredzētu lingvodidaktisko materiālu. Diplomdarbs ietver trīs nodaļas. Pirmajā nodaļā piedāvāts ieskats teorētiskajās atziņās, kas aktuālas un būtiskas pētāmās problēmas aspektā, otrajā nodaļā izmēģinājumdarbībā iesaistīto skolēnu pedagoģiski psiholoģiskais raksturojums, pētījumā iesaistītās klases raksturojums, trešajā nodaļā didaktiskā materiāla izstrāde un aprobācija. Pētījuma rezultātā secināts, ka izdevies pilnveidot un p…
Linguistica Lettica, Nr. 30
2022
Žurnāla "Linguistica Lettica" 30. numura tēma ir "Valodas bagātība slēpjas tās dažādībā". The theme of the 30th issue of the annual journal "Linguistica Lettica" is "The richness of language lies in its diversity".