Search results for "korpukset"

showing 10 items of 14 documents

An overview of research within the Genre and Multimodality framework

2017

This review article provides an overview of the research conducted within the Genre and Multimodality framework, which has been used to describe the multimodality of page-based documents and other multimodal artefacts over the past 15 years. The article explicates the motivation and inspiration for developing the framework, introduces its central theoretical concepts and presents its applications across a number of case studies. Finally, the article discusses the criticism directed towards the model and identifies avenues of future development. peerReviewed

060201 languages & linguisticsCultural StudiesMultimediaComputer sciencePage layoutCommunication05 social sciencesinformaatiomuotoilupage layout050801 communication & media studiesdocument06 humanities and the artsInformation designcomputer.software_genreData scienceReview articleMultimodality0508 media and communicationsgenre0602 languages and literatureCriticismkorpuksetcomputermultimodaalisuus
researchProduct

The International Comparable Corpus: Challenges in building multilingual spoken and written comparable corpora

2021

This paper reports on the efforts of twelve national teams in building the International Comparable Corpus (ICC; https://korpus.cz/icc) that will contain highly comparable datasets of spoken, written and electronic registers. The languages currently covered are Czech, Finnish, French, German, Irish, Italian, Norwegian, Polish, Slovak, Swedish and, more recently, Chinese, as well as English, which is considered to be the pivot language. The goal of the project is to provide much-needed data for contrastive corpus-based linguistics. The ICC corpus is committed to the idea of re-using existing multilingual resources as much as possible and the design is modelled, with various adjustments, on t…

Czech050101 languages & linguisticsHistorycontrastive linguisticsGermanIrish6121 Languages0501 psychology and cognitive sciencesGeneral Materials Sciencedata sustainabilityContrastive linguisticskielitiedevertaileva kielitiedeICC corpus05 social sciencescopyright050301 educationICE corpuskontrastiivinen tutkimus113 Computer and information scienceslanguage.human_languageLinguisticstekijänoikeusPivot languageInternational Corpus of EnglishlanguagekorpuksetWritten language0503 educationcomparable corpusSpoken language
researchProduct

Variation in the use of constructed action according to discourse type and age in Finnish Sign Language

2022

This paper presents a study of the use of constructed action (CA) in the stories and conversations of adult Finnish Sign Language (FinSL) signers of different ages. CA is defined here as a type of depiction in which a signer enacts the actions, feelings, thoughts and utterances of discourse referents with different parts of their body. Most studies on CA in sign languages have been done on the basis of signed storytelling, and little is known about how the use of CA varies in different discourse types. The use of CA has also been noted to vary between individual signers, but we do not yet know much about the socio-individual phenomena that may be linked to this variation. In the present stu…

Linguistics and LanguageSocial PsychologykeskustelunanalyysiCommunicationExperimental and Cognitive PsychologyLanguage and Linguisticsdiscourse typeconstructed actionviittomakieliagekielenkäyttödiskurssisuomalainen viittomakielikorpuksetvariationsign languagesLanguage & Communication
researchProduct

Oppimiskontekstin vaikutus oppijanpragmatiikkaan : astemääritteet leksikaalisina nallekarhuina

2015

Artikkelissa käsitellään oppimisympäristön vaikutusta astemääritteiden käyttöön. Astemääritteet ovat jonkin ominaisuuden asteen suurta, kohtalaista tai vähäistä määrää ilmaisevia, pragmaattista merkitystä kantavia adverbeja (esim. melko, hyvin, tosi). Oppimisympäristön vaikutusta käsitellään artikkelissa korpusten avulla. Vaikka tällä hetkellä käytössä olevat oppijansuomen aineistot eivät ole täysin vertailukelpoisia keskenään esimerkiksi tekstien tehtävänantojen suhteen, voidaan niiden avulla tehdä alustavia havaintoja oppimiskontekstin vaikutuksesta ja edelleen hypoteeseja tulevia tutkimuksia varten. Oppimiskontekstilla tarkoitetaan tässä tutkimuksessa sitä ympäristöä, jossa kieltä opitaa…

Linguistics and Languageoppimiskontekstilearner languagelcsh:Finnic. Baltic-Finniclcsh:PH91-98.5avainsana-analyysita6121corporaoppijankieliLanguage and LinguisticskorpustutkimusN-gramsdegree modifierskorpuksetkeyword analysisastemääritteetn-grammitlearning contextLähivõrdlusi. Lähivertailuja
researchProduct

Miten viittomakielen korpusta luodaan ja mihin sitä tarvitaan? Viittomakielten korpukset ja niiden tehtävät

2020

Artikkeli käsittelee suomalaisen ja suomenruotsalaisen viittomakielen korpusten luontia CFINSL-projektissa (Corpus project of Finland’s sign languages, Suomen viittomakielten korpusprojekti). Viittomakielillä ei ole kirjoitettua muotoa, joten korpusten laatiminen vaatii erilaista lähestymistä kuin korpusten luonti sellaisille puhutuille kielille, joilla on kirjoitettu muoto. Artikkelissa kuvataan ne menetelmät, joilla Jyväskylän yliopiston viittomakielen keskuksessa on koottu aineistoa suomalaisen ja suomenruotsalaisen viittomakielen korpukseen. Lisäksi kuvataan korpusaineiston teknistä käsittelyä, annotointia, metatietojen keruuta ja käsittelyä sekä aineiston säilytystä ja tutkijoiden käyt…

SignbankComputer sciencebusiness.industrySign languagecomputer.software_genreLexical databaseMetadataAnnotationsuomenruotsalainen viittomakieliviittomakielien korpussuomalainen viittomakieliGeneral Earth and Planetary ScienceskorpuksetArtificial intelligenceleksikkotietokantabusinesscomputerNatural language processingannotaatioGeneral Environmental ScienceSign (mathematics)Puhe ja kieli
researchProduct

The Corpus of Finnish Sign Language

2020

This paper presents the Corpus of Finnish Sign Language(Corpus FinSL), a structured and annotated collection of Finnish Sign Language (FinSL) videos published in May 2019 in FIN-CLARIN's Language Bank of Finland. The corpus is divided into two subcorpora, one of which comprises elicited narratives and the other conversations. All of the FinSL material has been annotated using ELAN and the lexical database Finnish Signbank. Basic annotation includes ID-glosses and translations into Finnish. The anonymized metadata of Corpus FinSL has been organized in accordance with the IMDI standard. Altogether, Corpus FinSL contains nearly 15 hours of video material from 21 FinSL users. Corpus FinSL has a…

corpus of Finnish sign languageresearchannotationFinnish signbankmetadatasuomalainen viittomakielikorpuksetlanguage bank of Finlandteaching
researchProduct

Corpora, phraseology and dictionaries : How does corpus research intersect language teaching and learning?

2016

This article discusses the role of corpus data in language learning and teaching as well as the benefits of using authentic language data in learner dictionary writing. It has been argued that acquiring and teaching a target language and its phraseology would benefit from the usage of naturally occurring language. In the research on learner language phraseology to date, there is a bias towards analyses of collocations and ngrams. The present article attempts, however, to widen this scope to other dimensions of phraseology, namely semantic preference and semantic prosody, which are more abstract and perhaps more difficult to learn than concrete co-occurring lexical items. This article introd…

kieltenopetuskorpustutkimuscorpus researchkorpuksetsanakirjatkielen oppiminenfraseologia
researchProduct

Selkosten Proust taipuu moneen : Iijoki-korpus ja digitaalisen tekstilouhinnan mahdollisuudet

2022

kirjallisuuden kielitekstinlouhintasuomenkielinen kirjallisuusPäätalo KallekaunokirjallisuuskorpuksetIijoki-sarjatekstintutkimus
researchProduct

Suomen viittomakielten korpusta rakentamassa

2019

Viittomakielikorpusten rakentaminen on lisääntynyt merkittävästi 2000-luvulla: ensimmäiset korpusprojektit käynnistyivät 2000-luvun alussa Australiassa ja Hollannissa, minkä myötä laajoja, koneluettavia aineistokokoelmia on ryhdytty rakentamaan useissa Euroopan maissa 2010-luvulla. Tässä artikkelissa tarkastellaan Suomen viittomakielten, suomalaisen ja suomenruotsalaisen viittomakielen, korpuksen syntyä. Artikkeli esittelee korpuksen rakennusvaiheita eli aineiston keräämistä, käsittelyä, annotointia, pitkäaikaissäilytystä sekä julkaisua tietosuojakysymyksineen. Lisäksi artikkelissa kuvaillaan, miten korpusaineistoa on käytetty ja voidaan hyödyntää viittomakielten tutkimuksessa sekä opetukse…

kuvatallenteettietosuojaviittomakielisuomenruotsalainen viittomakielimetadataannotointisuomalainen viittomakielikorpuksettutkimusaineisto
researchProduct

Building the Corpus of Finland-Swedish Sign Language : Acknowledging the Language History and Future Revitalization

2022

This paper presents the first steps in the process of creating a multimedia corpus for the severely endangered Finland-Swedish Sign Language (FinSSL). In the paper, we will first outline the history and current situation of FinSSL and then move on to describe some of the foundational choices which we have made both in the earlier data collection and at the start of the currently ongoing annotation work. Finally, we will bring up challenges related to the corpus data processing and discuss the future uses of the corpus, especially from the point of view of the FinSSL revitalization process. peerReviewed

multimediaviittomakielisuomenruotsalainen viittomakieliannotointikielen elvytyskorpuksetkielihistoria
researchProduct