Search results for "korpukset"
showing 10 items of 14 documents
An overview of research within the Genre and Multimodality framework
2017
This review article provides an overview of the research conducted within the Genre and Multimodality framework, which has been used to describe the multimodality of page-based documents and other multimodal artefacts over the past 15 years. The article explicates the motivation and inspiration for developing the framework, introduces its central theoretical concepts and presents its applications across a number of case studies. Finally, the article discusses the criticism directed towards the model and identifies avenues of future development. peerReviewed
The International Comparable Corpus: Challenges in building multilingual spoken and written comparable corpora
2021
This paper reports on the efforts of twelve national teams in building the International Comparable Corpus (ICC; https://korpus.cz/icc) that will contain highly comparable datasets of spoken, written and electronic registers. The languages currently covered are Czech, Finnish, French, German, Irish, Italian, Norwegian, Polish, Slovak, Swedish and, more recently, Chinese, as well as English, which is considered to be the pivot language. The goal of the project is to provide much-needed data for contrastive corpus-based linguistics. The ICC corpus is committed to the idea of re-using existing multilingual resources as much as possible and the design is modelled, with various adjustments, on t…
Variation in the use of constructed action according to discourse type and age in Finnish Sign Language
2022
This paper presents a study of the use of constructed action (CA) in the stories and conversations of adult Finnish Sign Language (FinSL) signers of different ages. CA is defined here as a type of depiction in which a signer enacts the actions, feelings, thoughts and utterances of discourse referents with different parts of their body. Most studies on CA in sign languages have been done on the basis of signed storytelling, and little is known about how the use of CA varies in different discourse types. The use of CA has also been noted to vary between individual signers, but we do not yet know much about the socio-individual phenomena that may be linked to this variation. In the present stu…
Oppimiskontekstin vaikutus oppijanpragmatiikkaan : astemääritteet leksikaalisina nallekarhuina
2015
Artikkelissa käsitellään oppimisympäristön vaikutusta astemääritteiden käyttöön. Astemääritteet ovat jonkin ominaisuuden asteen suurta, kohtalaista tai vähäistä määrää ilmaisevia, pragmaattista merkitystä kantavia adverbeja (esim. melko, hyvin, tosi). Oppimisympäristön vaikutusta käsitellään artikkelissa korpusten avulla. Vaikka tällä hetkellä käytössä olevat oppijansuomen aineistot eivät ole täysin vertailukelpoisia keskenään esimerkiksi tekstien tehtävänantojen suhteen, voidaan niiden avulla tehdä alustavia havaintoja oppimiskontekstin vaikutuksesta ja edelleen hypoteeseja tulevia tutkimuksia varten. Oppimiskontekstilla tarkoitetaan tässä tutkimuksessa sitä ympäristöä, jossa kieltä opitaa…
Miten viittomakielen korpusta luodaan ja mihin sitä tarvitaan? Viittomakielten korpukset ja niiden tehtävät
2020
Artikkeli käsittelee suomalaisen ja suomenruotsalaisen viittomakielen korpusten luontia CFINSL-projektissa (Corpus project of Finland’s sign languages, Suomen viittomakielten korpusprojekti). Viittomakielillä ei ole kirjoitettua muotoa, joten korpusten laatiminen vaatii erilaista lähestymistä kuin korpusten luonti sellaisille puhutuille kielille, joilla on kirjoitettu muoto. Artikkelissa kuvataan ne menetelmät, joilla Jyväskylän yliopiston viittomakielen keskuksessa on koottu aineistoa suomalaisen ja suomenruotsalaisen viittomakielen korpukseen. Lisäksi kuvataan korpusaineiston teknistä käsittelyä, annotointia, metatietojen keruuta ja käsittelyä sekä aineiston säilytystä ja tutkijoiden käyt…
The Corpus of Finnish Sign Language
2020
This paper presents the Corpus of Finnish Sign Language(Corpus FinSL), a structured and annotated collection of Finnish Sign Language (FinSL) videos published in May 2019 in FIN-CLARIN's Language Bank of Finland. The corpus is divided into two subcorpora, one of which comprises elicited narratives and the other conversations. All of the FinSL material has been annotated using ELAN and the lexical database Finnish Signbank. Basic annotation includes ID-glosses and translations into Finnish. The anonymized metadata of Corpus FinSL has been organized in accordance with the IMDI standard. Altogether, Corpus FinSL contains nearly 15 hours of video material from 21 FinSL users. Corpus FinSL has a…
Corpora, phraseology and dictionaries : How does corpus research intersect language teaching and learning?
2016
This article discusses the role of corpus data in language learning and teaching as well as the benefits of using authentic language data in learner dictionary writing. It has been argued that acquiring and teaching a target language and its phraseology would benefit from the usage of naturally occurring language. In the research on learner language phraseology to date, there is a bias towards analyses of collocations and ngrams. The present article attempts, however, to widen this scope to other dimensions of phraseology, namely semantic preference and semantic prosody, which are more abstract and perhaps more difficult to learn than concrete co-occurring lexical items. This article introd…
Selkosten Proust taipuu moneen : Iijoki-korpus ja digitaalisen tekstilouhinnan mahdollisuudet
2022
Suomen viittomakielten korpusta rakentamassa
2019
Viittomakielikorpusten rakentaminen on lisääntynyt merkittävästi 2000-luvulla: ensimmäiset korpusprojektit käynnistyivät 2000-luvun alussa Australiassa ja Hollannissa, minkä myötä laajoja, koneluettavia aineistokokoelmia on ryhdytty rakentamaan useissa Euroopan maissa 2010-luvulla. Tässä artikkelissa tarkastellaan Suomen viittomakielten, suomalaisen ja suomenruotsalaisen viittomakielen, korpuksen syntyä. Artikkeli esittelee korpuksen rakennusvaiheita eli aineiston keräämistä, käsittelyä, annotointia, pitkäaikaissäilytystä sekä julkaisua tietosuojakysymyksineen. Lisäksi artikkelissa kuvaillaan, miten korpusaineistoa on käytetty ja voidaan hyödyntää viittomakielten tutkimuksessa sekä opetukse…
Building the Corpus of Finland-Swedish Sign Language : Acknowledging the Language History and Future Revitalization
2022
This paper presents the first steps in the process of creating a multimedia corpus for the severely endangered Finland-Swedish Sign Language (FinSSL). In the paper, we will first outline the history and current situation of FinSSL and then move on to describe some of the foundational choices which we have made both in the earlier data collection and at the start of the currently ongoing annotation work. Finally, we will bring up challenges related to the corpus data processing and discuss the future uses of the corpus, especially from the point of view of the FinSSL revitalization process. peerReviewed