0000000000916851

AUTHOR

Jarmo Harri Jantunen

showing 22 related works from this author

Korpusavusteinen virheanalyysi tarkkuuden kehityksestä EVK:n taitotasoilla A2–B2

2020

Artikkelissa tarkastellaan kielitaidon taitotasoittaista kehittymistä potentiaalisten esiintymien analyysin (Potential Occasion Analysis, Thewissen, 2015) avulla. Kehittymistä analysoidaan tarkkuuden näkökulmasta, ja sitä mitataan kohdekielen muoto- ja käyttökonventioista poikkeavien muotojen määrällä. Tutkimus on korpuspohjaista virheanalyysia (Corpus-aided Error Analysis, Dagneaux, Dennes & Granger, 1998), ja se perustuu taitotasoilla havaittujen, yhdeksään virheluokkaan sijoittuvien virheiden määrien tilastolliseen testaukseen. Aineistona on Kansainvälinen oppijansuomen korpus(ICLFI). Analyysi osoittaa, että merkittävintä kehitys on tasojen B1 ja B2 välillä; tasojen A2 ja B1 välillä tark…

corpus-aided error analysispotential occasion analysisaccuracytarkkuusPoint (typography)Computer sciencepotentiaalisten esiintymien analyysidevelopment of language proficiencykielitaitoLinguisticsRegressionCulminationkielitaidon kehittyminenError analysisPhraseologyGeneral Earth and Planetary SciencesLanguage proficiencykehityskorpusavusteinen virheanalyysiGeneral Environmental ScienceStatistical hypothesis testingPuhe ja kieli
researchProduct

Mapping Digital Discourses of the Capital Region of Finland : Combining Onomastics, CADS, and GIS

2022

This article discusses the three Finnish city names Helsinki, Espoo, and Vantaa, and the urban discourses that surround them. The study reveals patterns of socio-spatial differentiation by examining what meanings people attach to these capital region cities and investigating how these meanings are expressed in online discourses. Using the methodological approach of corpus-assisted onomastics (CAO), this study incorporates onomastics, geographical information systems (GIS), and corpus linguistics. This interdisciplinary research also examines how corpus-assisted discourse studies (CADS) and GIS can be combined to reveal and visualize the contextual information and discursive patterns of topo…

geographic information systemspaikannimetLinguistics and Languagekorpuslingvistiikkaverkkokeskustelueducationcorpus linguisticsCADScorpus-assisted discourse studiespääkaupunkiseutu (Suomi)corpus-assisted onomasticsGISdiskurssintutkimusLanguage and Linguisticstoponymsnimistöntutkimuspaikkatietojärjestelmät519 Social and economic geographykorpustutkimus6121 Languagesdiscourse prosodyFinlandDemography
researchProduct

Homot ja heterot Suomi24:ssä: analyysi digitaalisista diskursseista

2018

Artikkelissani tarkastelen Suomi24-keskustelupalstan homouteen ja heterouteen liittyviä toistuvia diskursseja. Analyysi on toteutettu korpusavusteisena diskurssintutkimuksena (CADS), jossa suureen dataan perustuva tilastollinen avainsana-analyysi nostaa esiin suomalaisen yhteiskunnan sosiaalisesti jaetut diskurssit. Tulokset yhtäältä tukevat aiempia media-analyyseissä tehtyjä havaintoja voimakkaista affekteista ja vihapuheesta sekä homoseksuaalisuuden politisoitumisesta ja uskonnollistumisesta. Toisaalta se myös paljastaa homodiskurssien henkilöitymisen tai liittymisen tiettyihin henkilöryhmiin ja paikkoihin. Heterodiskurssit puolestaan eroavat selvästi homodiskursseista: niille on tyypilli…

keskustelupalstatsocial mediamedia_common.quotation_subjectsosiaalinen mediata6121Human sexualityhomoseksuaalisuusheteroseksuaalisuusfraseologiaSocial groupdiskurssiphraseologyHomosexualitySociologyta518General Environmental Sciencemedia_commondiscussion forumheterosexualityGender studieshomosexualityHeterosexualitySexual orientationGeneral Earth and Planetary SciencesdiscourseArtikkelitKeyword analysisPuhe ja kieli
researchProduct

Syntisen pääkaupungin viaton äänne : kielipolitiikkaa, kaupunkikielihistoriaa, sukupuolittunutta kielenkäyttöä ja vähän queeriäkin

2021

Arvioitu teos: Mia Halonen, Samu Nyström, Heikki Paunonen & Johanna Vaattovaara: Stadin syntinen s. Helsinki: Art House 2020. 353 s. isbn 978-951-884-755-0.

Linguistics and Languagesuomen kielislangiindeksaalisuusasenteetääntäminenkirjaimetLanguage and Linguisticssosiolingvistiikkasukupuolittuminenkirja-arvostelutHelsinkimurteetpuhekieli
researchProduct

Understanding Estonian phraseological units on the basis of Finnish : contributing and misleading factors

2020

Vironkielistä tekstiä lukevien suomalaisten on havaittu hyödyntävän monenlaisia strategioita selvittääkseen sukukielen sanojen merkityksiä. Yksi niistä on pohjustaminen (priming). Kun kyseessä on fraseologinen yksikkö, yksi osa (prime) pohjustaa toisen osan eli kohdesanan (targetin) esiintymistä, mikäli prime on tunnistettavissa äidinkielen perusteella. Tässä artikkelissa kuvaamme muutamia erityistilanteita. Miten pohjustimen ja kohdesanan välinen etäisyys tai teemanvaihdos vaikuttavat ’petollisen ystävän’ ymmärtämiseen? Lisäksi tutkimme sitä, miten ahdasrajainen semanttinen kategoria ohjaa siitä puuttuvan jäsenen merkityksen löytämistä ja millaisia perusteita käännösratkaisuille on löydett…

viron kieliLinguistics and Languagesanasemantiikkasuomen kielimutual intelligibility of languagesmedia_common.quotation_subjectlcsh:Finnic. Baltic-Finniclcsh:PH91-98.5Context (language use)leksikologiaLanguage and LinguisticsfinnishtargetfraseologiaReading (process)Similarity (psychology)semantic primingprimesemanttinen pohjustaminenmedia_commonkielten keskinäinen ymmärrettävyysymmärrettävyyspohjustinFinnishEstonianVariety (linguistics)estonianEstonianLinguisticslanguage.human_languagevirolanguagesuomiSource textAffect (linguistics)PsychologyMeaning (linguistics)kohdesana
researchProduct

Oppimiskontekstin vaikutus oppijanpragmatiikkaan : astemääritteet leksikaalisina nallekarhuina

2015

Artikkelissa käsitellään oppimisympäristön vaikutusta astemääritteiden käyttöön. Astemääritteet ovat jonkin ominaisuuden asteen suurta, kohtalaista tai vähäistä määrää ilmaisevia, pragmaattista merkitystä kantavia adverbeja (esim. melko, hyvin, tosi). Oppimisympäristön vaikutusta käsitellään artikkelissa korpusten avulla. Vaikka tällä hetkellä käytössä olevat oppijansuomen aineistot eivät ole täysin vertailukelpoisia keskenään esimerkiksi tekstien tehtävänantojen suhteen, voidaan niiden avulla tehdä alustavia havaintoja oppimiskontekstin vaikutuksesta ja edelleen hypoteeseja tulevia tutkimuksia varten. Oppimiskontekstilla tarkoitetaan tässä tutkimuksessa sitä ympäristöä, jossa kieltä opitaa…

Linguistics and Languageoppimiskontekstilearner languagelcsh:Finnic. Baltic-Finniclcsh:PH91-98.5avainsana-analyysita6121corporaoppijankieliLanguage and LinguisticskorpustutkimusN-gramsdegree modifierskorpuksetkeyword analysisastemääritteetn-grammitlearning contextLähivõrdlusi. Lähivertailuja
researchProduct

Korpusavusteinen diskurssintutkimus (CADS): analyysiesimerkki homouden ja heterouden digitaalisista diskursseista

2018

The article aims at combining two methodological approaches, namely corpus linguistics and discourse studies. Both of these approaches are present in corpus-assisted discourse studies (CADS) which makes use of both quantitative and qualitative methodologies. First, an attempt is made to discuss the differences and similarities of these two traditions based on Leech’s (2000) listing. However, it turns out that this listing does not include all necessary viewpoints, and those are further discussed. In the empirical section of the paper, the Suomi24 corpus is analysed in order to provide an example of CADS. The analysis was carried out through collocation and discourse prosody analyses. The re…

General Energykorpusavusteinen diskurssintutkimus pervokielitiede kollokaatio diskurssiprosodia homoseksuaalisuus heteroseksuaalisuuscorpus-assisted discourse studies queer linguistics collocation discourse prosody homosexuality heterosexualityArtikkelitSociologyAFinLA-e: Soveltavan kielitieteen tutkimuksia
researchProduct

Korpuspohjaista oppijansanakirjaa tekemässä: esimerkkinä ConLexis

2013

Artikkelimme kasittelee korpuspohjaisia oppijansanakirjoja. Sahkoisiin aineistoihin ja kielenkaytosta hankittuun tutkimukselliseen tietoon perustuvat sanakirjat ovat edelleen harvinaisia, ja kielenoppijoille niita on tarjolla hyvin vahan. Suomesta tallaisia sanakirjoja ei ole ollut lainkaan. Esittelemme yleisesti oppijoille suunnattujen sahkoisten sanakirjojen vaatimuksia ja tarkemmin uuden tekeilla olevan ConLexis-verkkosanakirjan suunnittelutyota, tavoitteita ja sisaltoa. ConLexis on suunnattu B1-tason ja sita edistyneemmille kielenoppijoille, mutta sita voivat opettajat kayttaa opetuksensa tukena alemmillakin taitotasoilla. Sana-artikkeleissa esitetty tieto perustuu laajoihin korpusanaly…

Linguistics and Languagekorpussanakirjatantonyymitkollokaatiotverkko-oppimateriaalitsynonyymitlcsh:Finnic. Baltic-Finniclcsh:PH91-98.5Language and LinguisticsoppijansanakirjatfraseologiaLähivõrdlusi
researchProduct

Corpora, phraseology and dictionaries : How does corpus research intersect language teaching and learning?

2016

This article discusses the role of corpus data in language learning and teaching as well as the benefits of using authentic language data in learner dictionary writing. It has been argued that acquiring and teaching a target language and its phraseology would benefit from the usage of naturally occurring language. In the research on learner language phraseology to date, there is a bias towards analyses of collocations and ngrams. The present article attempts, however, to widen this scope to other dimensions of phraseology, namely semantic preference and semantic prosody, which are more abstract and perhaps more difficult to learn than concrete co-occurring lexical items. This article introd…

kieltenopetuskorpustutkimuscorpus researchkorpuksetsanakirjatkielen oppiminenfraseologia
researchProduct

The International Comparable Corpus: Challenges in building multilingual spoken and written comparable corpora

2021

This paper reports on the efforts of twelve national teams in building the International Comparable Corpus (ICC; https://korpus.cz/icc) that will contain highly comparable datasets of spoken, written and electronic registers. The languages currently covered are Czech, Finnish, French, German, Irish, Italian, Norwegian, Polish, Slovak, Swedish and, more recently, Chinese, as well as English, which is considered to be the pivot language. The goal of the project is to provide much-needed data for contrastive corpus-based linguistics. The ICC corpus is committed to the idea of re-using existing multilingual resources as much as possible and the design is modelled, with various adjustments, on t…

Czech050101 languages & linguisticsHistorycontrastive linguisticsGermanIrish6121 Languages0501 psychology and cognitive sciencesGeneral Materials Sciencedata sustainabilityContrastive linguisticskielitiedevertaileva kielitiedeICC corpus05 social sciencescopyright050301 educationICE corpuskontrastiivinen tutkimus113 Computer and information scienceslanguage.human_languageLinguisticstekijänoikeusPivot languageInternational Corpus of EnglishlanguagekorpuksetWritten language0503 educationcomparable corpusSpoken language
researchProduct

Lesbonormatiivisuuksien ristipaineessa: Määrällistä ja laadullista analyysiä Suomi24-verkkokeskusteluista

2021

Artikkelissamme identifioimme tilastollisella avainsana-analyysillä Suomi24-keskustelufoorumilla tuotettuja lesboerityisiä diskursseja, joissa – toisin kuin homodiskursseissa – keskitytään seksuaaliseen suuntautumiseen, sukupuoleen ja ulkonäköön. Lesbodiskursseja tarkastelemme edelleen teoriavetoisen kriittisen lähiluvun avulla. Analyysi nostaa esiin keskusteluja, joissa heteronormatiivisuuden kautta määrittyvä lesbous voidaan kokea hyvinkin ristiriitaiseksi ja ahdistavaksi. Käyttämällä hyväksi lesbomatriisin ja lesbonormatiivisuuden käsitteitä osoitamme, kuinka sekä nais- että miesfeminiinistä lesboutta ja lesboparisuhteita koskevissa keskusteluissa nojataan yhtäältä normatiiviseen ajattel…

verkkokeskustelukeskustelupalstatDiscourse analysislesbonormatiivisuusGender studiesheteronormatiivisuuskorpusavusteinen diskurssintutkimusQualitative analysislesbousdiskurssikorpustutkimusClose readingSexual orientationNormativeKeyword analysisSociologyLesbian5141 Sosiologia
researchProduct

Verkkokeskustelujen kansa

2018

People 'kansa' in digital discourses. 
 Corpus-assisted discourse analysis on Suomi24 discussion forum. 
  In this paper, our objective is to analyze how participants use the word kansa 'people' on the largest discussion forum in Finland, called Suomi24 (Finland 24). Our main research questions are the following: 1) What kinds of discourses the forum participants relate to kansa 'people' and 2) what kinds of representations the writers attach to kansa and what kinds of meanings they construct for the term on the discussion forum.  
  Our theoretical and methodological approach is based on corpus-assisted discourse analysis and on digital discourse analysis.  Studying the data…

BlamePower (social and political)Action (philosophy)media_common.quotation_subjectDiscourse analysisSocial mediaGeneral MedicineSociologyIdeologyRepresentation (arts)Object (philosophy)Linguisticsmedia_commonSananjalka
researchProduct

Korpusonomastinen tutkimus slanginimistä Hesa ja Stadi digitaalisissa diskursseissa

2019

Artikkelissamme selvitämme Helsinkiä tarkoittavien slanginimien, Hesan ja Stadin, käyttöä uudentyyppisen aineiston ja menetelmän avulla. Aiemmissa näitä nimiä koskevissa tutkimuksissa lähtökohta on ollut kvalitatiivinen, mutta tässä tutkimuksessa lähdemme liikkeelle laajasta digitaalisesta aineistosta ja tilastollisista menetelmistä. Tutkimuksemme on uusi avaus nimistöntutkimuksessa, ja nimitämme sitä korpusavusteiseksi nimistöntutkimukseksi, lyhyemmin korpusonomastiikaksi.
 Aineistonamme on laaja Suomi24-keskustelufoorumista muodostettu ja Kielipankista saatava Suomi24-korpus, josta olemme hakeneet Hesa- ja Stadi-nimet. Tutkimus toteutetaan korpusavusteisena diskurssintutkimuksena. Mo…

060201 languages & linguisticspaikannimetkorpusavusteinen diskurssintutkimus (CADS)nimistöntutkimuskorpustutkimus0602 languages and literature6121 Kielitieteet06 humanities and the artsGeneral MedicineArtikkelitnimistöntutkimus paikannimet korpustutkimus diskurssiprosodia korpusavusteinen diskurssintutkimus (CADS)060202 literary studiesdiskurssiprosodia
researchProduct

Oppijankieliaineistojen annotointi – esimerkkinä ICLFI:n annotoinnin prosessit, ongelmat ja ratkaisut

2014

This article illustrates the grammatical and error annotation of learner language with the help of the International Corpus of Learner Finnish (ICLFI). In particular, we will focus on issues arising from handling with at least semi-automatic methods a morphologically rich language. What makes this corpus special compared to, for example, English-language material, is the frequent variation in di" erent forms and related errors, both due to the rich morphology of the target language. This article begins with a description of the design and implementation process of both the grammatical and error annotation, followed by a brief introduction to the material for which the annotations were desig…

learner language corporaannotationannotointiArtikkelitcorpus studyerror annotation
researchProduct

Oppijansuomen sähköiset tutkimusaineistot : nykytilanne

2015

[Johdanto] Korpukset tarjoavat kielentutkijoille mahdollisuuden tutkia kieltä laajojen sähköisten aineistojen avulla. Nykyisin suomen kielen tutkijoiden hyödynnettävissä on paitsi korpuksia, jotka koostuvat äidinkielisten suomenpuhujien kielestä, myös useita sellaisia korpuksia, jotka sisältäjät oppijansuomea. Maailmanjaajuisesti oppijankieliaineistot ovat yhä kasvava korpusaineistojen muoto, ja aineistoja on syntynyt runsaasti myös muista kielistä kuin englannista, joka on pitkään ollut ja on edelleenkin korpusten valtakieli. [Jatkuu, ks. artikkeli] peerReviewed

suomen kielikorpuksetkielentutkimus
researchProduct

Learner Language

2015

educational linguisticslearner language
researchProduct

Commenting on poverty online : A corpus-assisted discourse study of the Suomi24 forum

2020

This paper brings new insight to poverty and social exclusion through an analysis of how poverty-related issues are commented on in the largest online discussion forum in Finland: Suomi24 (‘Finland24’). For data, we use 32,407 posts published in the forum in 2014 that contain the word köyhä (‘poor’) or a predefined semantically similar word. We apply the Corpus-Assisted Discourse Studies (CADS) method, which combines quantitative methods and qualitative discourse analysis. This methodological solution allows us to analyse both large-scale tendencies and detailed expressions and nuances on how poverty is discussed. The quantitative analysis is conducted with topic modelling, an unsupervised …

kommentointipovertykeskustelupalstatdiscussion forumitseilmaisuretoriikkasyrjäytyminentopic modellingSuomi24self-expressiondiskurssianalyysikommentithuono-osaisuusviestintäkulttuuriilmaukset6121 Languagesdiscourse analysisköyhyys
researchProduct

Verkkokeskustelujen kansa : korpusavusteinen diskurssianalyysi Suomi24-keskustelupalstasta

2018

People 'kansa' in digital discourses. Corpus-assisted discourse analysis on Suomi24 discussion forum. In this paper, our objective is to analyze how participants use the word kansa 'people' on the largest discussion forum in Finland, called Suomi24 (Finland 24). Our main research questions are the following: 1) What kinds of discourses the forum participants relate to kansa 'people' and 2) what kinds of representations the writers attach to kansa and what kinds of meanings they construct for the term on the discussion forum. Our theoretical and methodological approach is based on corpus-assisted discourse analysis and on digital discourse analysis. Studying the data from two different persp…

representaatioverkkokeskusteluavainsana-analyysidigitaalinen diskurssianalyysikorpuksetkorpusavusteinen diskurssintutkimusdiskurssintutkimusrepresentation (creation related to information)diskurssianalyysi
researchProduct

Sanojen sähköiset suhteet

2014

Professorin juhlaluento 11. joulukuuta 2013 Jyväskylän yliopistossa nonPeerReviewed

lektiokielenkäyttömerkityksetsuhteetsanatjuhlaluento
researchProduct

Kaapin ovet selällään: vuorovaikutuksen heteronormatiivisuutta rikkomassa

2014

Sukupuolivähemmistöihin kuuluvat henkilöt joutuvat elämänsä aikana päättämään useasti, millaisia omaan suuntautumiseensa liittyviä kielellisiä tekoja (perfomatiiveja) he tekevät ja miten nämä vaikuttavat heidän elämäänsä. Yksi tärkeimmiksi koetuista ja samalla vaikeimmista asioista on omasta seksuaali-identiteetistä kertominen eli niin sanottu kaapista ulos tuleminen. Ulostulo koskee yhtä hyvin homoja, lesboja, biseksuaaleja kuin trans- ja intersukupuolisiakin (hlbti-henkilöt). Myös omasta parisuhteesta kertominen voi aiheuttaa omat ongelmansa monissa tilanteissa, kuten viranomaisten kanssa asioidessa. Käytännössä seksuaalivähemmistöön kuuluvan henkilön elämä on läpi elämän kestävää tasapai…

vuorovaikutuskielenkäyttösanavalinnatsukupuolivähemmistötseksuaalivähemmistötkieliparlance
researchProduct

Slanginimet Hesa ja Stadi Suomi24-keskusteluissa : korpusonomastinen kurkistus

2020

Nimet Hesa ja Stadi mielletään melko latautuneiksi, ja niihin liitetään paljon mielikuvia. Monilla on myös käsitys siitä, ketkä näitä nimiä käyttävät. Mutta millaisia ovat näihin slanginimiin liittyvät keskustelut todellisuudessa? Kurkistus Suomen suosituimmalle keskustelupalstalle paljastaa, mistä puhutaan silloin, kun Helsingistä puhutaan slanginimillä. nonPeerReviewed

paikannimetnimistöntutkimuskeskustelupalstatkorpustutkimusslangiverkkokeskusteluhelsinkiläisyys
researchProduct

Korpuspohjaista oppijansanakirjaa tekemässä: esimerkkiinä ConLexis

2013

Artikkelimme käsittelee korpuspohjaisia oppijansanakirjoja. Sähköisiin aineistoihin ja kielenkäytöstä hankittuun tutkimukselliseen tietoon perustuvat sanakirjat ovat edelleen harvinaisia, ja kielenoppijoille niitä on tarjolla hyvin vähän. Suomesta tällaisia sanakirjoja ei ole ollut lainkaan. Esittelemme yleisesti oppijoille suunnattujen sähköisten sanakirjojen vaatimuksia ja tarkemmin uuden tekeillä olevan ConLexis-verkkosanakirjan suunnittelutyötä, tavoitteita ja sisältöä. ConLexis on suunnattu B1-tason ja sitä edistyneemmille kielenoppijoille, mutta sitä voivat opettajat käyttää opetuksensa tukena alemmillakin taitotasoilla. Sana-artikkeleissa esitetty tieto perustuu laajoihin korpusanaly…

korpussanakirjatcorpus dictionariesverkko-oppimateriaalitlearner dictionariesonline materialsoppijansanakirjat
researchProduct