Search results for "korpus"
showing 10 items of 98 documents
Korpusonomastinen tutkimus slanginimistä Hesa ja Stadi digitaalisissa diskursseissa
2019
Artikkelissamme selvitämme Helsinkiä tarkoittavien slanginimien, Hesan ja Stadin, käyttöä uudentyyppisen aineiston ja menetelmän avulla. Aiemmissa näitä nimiä koskevissa tutkimuksissa lähtökohta on ollut kvalitatiivinen, mutta tässä tutkimuksessa lähdemme liikkeelle laajasta digitaalisesta aineistosta ja tilastollisista menetelmistä. Tutkimuksemme on uusi avaus nimistöntutkimuksessa, ja nimitämme sitä korpusavusteiseksi nimistöntutkimukseksi, lyhyemmin korpusonomastiikaksi.
 Aineistonamme on laaja Suomi24-keskustelufoorumista muodostettu ja Kielipankista saatava Suomi24-korpus, josta olemme hakeneet Hesa- ja Stadi-nimet. Tutkimus toteutetaan korpusavusteisena diskurssintutkimuksena. Mo…
Nosacījuma palīgteikumi Britu nacionālā korpusa tirdzniecības sadaļā
2015
Bakalaura darbā tiek pētīti nosacjuma palīgteikumi Britu Nacionālā Korpusa tirzdniecības sadaļā. Pastāv dažādu veidu nosacījuma palīgteikumi, un to lietošanas nolūks atšķiras. Tie tiek izmantoti dažādās jomās: gan ikdienas komunikācijā, gan biznesa, gan tirzdniecības jomās. Nosacījuma palīgteikumus angļu valodā izmanto, lai izteiktu vispārīgus faktus un īstus vai neīstus notikumus. Darba mērķis ir izpētīt nosacījuma palīgteikumus Britu Nacionālā Korpusa tirzdniecības sadaļā, lai noskaidrotu, kādu funkciju tie pilda teikumos. Pētījuma darba metode ir kvantitatīva un kvalitatīva uz korpusu balstīta nosacījuma palīgteikumu analīze, izmantojot konkordances metodi. Pētījuma rezultāti attēlo visb…
Vārdu savienojumi ar jēdzienu Market darījumu angļu valodā
2015
Bakalaura darba tēma ir Vārdu savienojumi ar jēdzienu Market darījumu angļu valodā. Darba mērķis ir atrast un analizēt vārdu savienojumus ar jēdzienu market darījumu angļu valodā. Vārdu savienojumi tika meklēti izmantojot konkordance funkciju Britu Nacionālajā Korpusā, sadaļā tirdzniecības angļu valoda. Tālāk vārdu savienojumi tika analizēti pēc to definīcijām un sadalīti atbilstoši pēc to tipiem. Pētījuma rezultāti atklāja, ka vārdu savienojumi, lai gan šķiet viegli saprotami, jo katrs vārds atsevišķi ir labi zināms, tomēr lietojot citā kontekstā būtiski maina vārdu un to savienojumu nozīmi. Tādēļ ir svarīgi būt informētam par vārdu savienojumu nozīmi, lai varētu piedalīties diskusijās par…
Ēšanas tvītu modelēšana ar mašīnmācīšanās metodēm
2020
Darbā tiek aprakstīta apstrāde un modelēšana konkrētai no mikroblogošanas vietnes Twitter iegūtai datu kopai, kura ir par pārtikas produktu un ēšanas/dzeršanas tematiku, izmantojot mašīnmācīšanās metodes. Darba sākumā tiek izpētīta iegūtā datu kopa un no tās tiek izveidots datu korpuss. Šis korpuss tiek izanalizēts dažādos šķērsgriezumos un publicēts publiski citiem interesentiem. Kā viens no mašīnmācīšanās modeļiem tiek izstrādāts sentimenta analizators, kurš nosaka tvīta noskaņojumu. Izstrādes procesā maksimālā efektivitāte bijusi, ka vairāk kā pusi no novērtēšanas datiem modelis ir spējis pareizi novērtēt, saliekot vairākus tvītu datu kopas kopā.
Linguistica Lettica, Nr. 30
2022
Žurnāla "Linguistica Lettica" 30. numura tēma ir "Valodas bagātība slēpjas tās dažādībā". The theme of the 30th issue of the annual journal "Linguistica Lettica" is "The richness of language lies in its diversity".
Sociālā tīkla Twitter datu korpusa izveide laikā segmentētu emociju kopu analīzei
2021
Bakalaura darba mērķis ir izpētīt emociju lietojumu sociālajā tīklā Twitter dažādos laika posmos un noteikt kā paustās emocijas mainās, piemēram, diennakts laikā. Mērķa sasniegšanai tiks apskatīta emociju pētniecības sociālajos tīklos, tās nepieciešamība un priekšrocības, tiks apskatīta emociju sistēma no kuras tiks izvēlēti pētījumā izmantotie emocijvārdi. Tiks izveidots Twitter datu analizēšanas korpuss, izmantojot Python programmēšanas valodu, kurā būs iespējams atlasīt Twitter ierakstus latviešu valodā pēc noteiktiem parametriem un iespēja apskatīt dažādas diagrammas, kurās tiks attēloti atlasītie dati, kā arī būs iespējams apskatīties atlasītos ierakstus tabulā. Darba rezultātā tiks iz…
Zur Produktivität des Musterbegriffs zur holistischen Charakterisierung von Fachtextsorten. Fallstudien am Beispiel des Finanzdiskurses
2021
International audience; [Kontextualisierung] Die kontinuierliche Ausweitung des Phraseologie-Begriffs, insbesondere unter dem Einfluss korpuslinguistischer Ansätze, erlebt mit dem „Muster“-Begriff – wie er z.B. von Stein/Stumpf (2019) konzeptualisiert wird – eine erkenntnistheoretisch und praxisbezogen weitreichende Wende. Wie von den beiden Autoren explizit erfordert (Stein/Stump 2019: 264), soll der Begriff deshalb nicht auf Standardsprache eingeschränkt werden, weil „vorgeformten Einheiten stets eine charakteristische Dia-Markierung innewohnt“. Fachdiskurse, welche heute an der Schnittstelle zwischen diastratischer und diaphasischer Variation angesiedelt werden (Dittmar 1997, Hoffmann 20…
Wie vergleichbar sind vergleichbare und parallele Fachkorpora? Ergebnisse einer Pilotstudie zum Sprachenpaar dt./frz. in Finanzdiskursen
2021
International audience
Fachsprachliche Konstruktionen? Zur korpuslinguistischen Neufundierung des Lexik-Grammatik-Kontinuums in stark formalisierten Fachtextsorten
2017
International audience; [Problemstellung und Thesen] Folgender Vorschlag reiht sich hauptsächlich in den ersten thematischen Strang des Calls für die Sektion ‚Grammatik und Grammatikographie’ ein, wobei die Forschungsergebnisse auch didaktisch, also für die „Entwicklung und Erstellung von Lernergrammatiken“ (2. Strang), verwertet werden können. Er geht der Frage nach dem Mehrwert korpuslinguistischer Instrumentarien für die Analyse von Fachtexten mit hohem Grad an Formelhaftigkeit nach. Der Beitrag vertritt folgende Thesen:a.Sind die linguistischen – auch morpho-syntaktischen – Merkmale von Fachtexten nicht qualitativer, sondern quantitativer Natur (Roelcke 20103), so können sie so gut wie …
Korpusavusteinen diskurssintutkimus (CADS): analyysiesimerkki homouden ja heterouden digitaalisista diskursseista
2018
The article aims at combining two methodological approaches, namely corpus linguistics and discourse studies. Both of these approaches are present in corpus-assisted discourse studies (CADS) which makes use of both quantitative and qualitative methodologies. First, an attempt is made to discuss the differences and similarities of these two traditions based on Leech’s (2000) listing. However, it turns out that this listing does not include all necessary viewpoints, and those are further discussed. In the empirical section of the paper, the Suomi24 corpus is analysed in order to provide an example of CADS. The analysis was carried out through collocation and discourse prosody analyses. The re…