Search results for "corpus"
showing 10 items of 698 documents
The Corpus of Finnish Sign Language
2020
This paper presents the Corpus of Finnish Sign Language(Corpus FinSL), a structured and annotated collection of Finnish Sign Language (FinSL) videos published in May 2019 in FIN-CLARIN's Language Bank of Finland. The corpus is divided into two subcorpora, one of which comprises elicited narratives and the other conversations. All of the FinSL material has been annotated using ELAN and the lexical database Finnish Signbank. Basic annotation includes ID-glosses and translations into Finnish. The anonymized metadata of Corpus FinSL has been organized in accordance with the IMDI standard. Altogether, Corpus FinSL contains nearly 15 hours of video material from 21 FinSL users. Corpus FinSL has a…
The C-ORAL-BRASIL project for Brazilian Portuguese spoken corpora
2020
En aquest article presentem un subconjunt de corpus orals de la família C-ORAL, concretament, el corpus C-ORAL-BRASIL de portuguès brasiler espontani (PB). Derivat de la branca no-europea del projecte C-ORAL-ROM (Cresti i Moneglia 2005), el projecte C-ORAL-BRASIL ha aplegat uns corpus orals de PB de tercera generació, el qual destaca no sols com a corpus de PB, sinó també com una bona eina per a l’estudi de la llengua parlada en general, gràcies a algunes millores metodològiques i tecnològiques. A més dels recursos per a l’estudi del PB oral, presentem un conjunt de minicorpus creats per a l’estudi específic de l’estructura informativa (també en altres llengües a més del PB); així mateix, t…
Corpus oral de hablantes bilingües de aimara-español.
2021
El “Corpus oral de hablantes bilingües de aymara-español” proporciona a todas las personas interesadas una fuente de datos a través de la cual, investigar las características de la variedad del español definida en la literatura (Escobar 1978) como “español andino ” y buscar respuestas a las preguntas relativas a los fenómenos lingüísticos presentes en el español hablado por los bilingües de español-lengua andina, en general, y en el español hablado por los bilingües de español-aimara, en particular. El texto reúne las trascripciones de veinte grabaciones procedentes de Bolivia y Chile que fueron recolectadas entre 2014 y 2019. La parte del corpus procedente de Bolivia fue recolectada en las…
L’ambiguïté anaphorique et la résolution automatique de l’anaphore pronominale
2019
Pronominal anaphores can create ambiguities when requesting the correct antecedent. In a context of automation of linguistic and textual processing, several researchers in the field of automatic language processing (TAL) have put in place various approaches to solve the problem. We propose to adapt these approaches to the automatic resolution of pronominal anaphors in a closed body of abstracts of French literary works (RESUMAN).Firstly, linguistic, textual and cognitive models are presented, which report on the functioning and interpretation of personal pronouns in French texts. Then, the interpretation procedures of the pronominalanaphors are exposed : the procedure of minimal distance, t…
U or non-U?: A study on social factors and word choices in contemporary British English.
2010
Sosiaaliluokalla, sukupuolella sekä iällä on todistetusti vaikutusta kielenkäyttöön. Niiden vaikutusta on tutkittu puhutussa kielessä ääntämisen sekä sanavalinnan näkökulmista. Ääntämisen ja näiden muuttujien keskinäistä suhdetta on tutkittu hiljattain, mutta sanavalintojen ja sosiaalitekijöiden suhteesta ei ole viimeaikaisia tutkimuksia. Koska kieli muuttuu jatkuvasti, tämän tutkimuksen tarkoitus oli selvittää sosiaalitekijöiden sekä sanavalintojen suhdetta nykyaikaisessa brittienglannissa. Tutkimus perustui Kate Foxin kirjaan Watching the English: The Hidden Rules of English Behaviour (2004), jossa Fox jakaa 14 sanaa pareiksi, joista toinen on yläluokkainen ja toinen alaluokkainen termi.…
Korpusavusteinen virheanalyysi tarkkuuden kehityksestä EVK:n taitotasoilla A2–B2
2020
Artikkelissa tarkastellaan kielitaidon taitotasoittaista kehittymistä potentiaalisten esiintymien analyysin (Potential Occasion Analysis, Thewissen, 2015) avulla. Kehittymistä analysoidaan tarkkuuden näkökulmasta, ja sitä mitataan kohdekielen muoto- ja käyttökonventioista poikkeavien muotojen määrällä. Tutkimus on korpuspohjaista virheanalyysia (Corpus-aided Error Analysis, Dagneaux, Dennes & Granger, 1998), ja se perustuu taitotasoilla havaittujen, yhdeksään virheluokkaan sijoittuvien virheiden määrien tilastolliseen testaukseen. Aineistona on Kansainvälinen oppijansuomen korpus(ICLFI). Analyysi osoittaa, että merkittävintä kehitys on tasojen B1 ja B2 välillä; tasojen A2 ja B1 välillä tark…
Lexical verbs for medical professionals
2019
In recent years, English has become the lingua franca of medicine and the language teaching profession has seen the emergence of im- plementing English for Medical Purposes (EMP) courses. The needs of EMP learners are very specific and EMP teachers who are language experts and not medical ones need to develop materials that are in line with EMP learners’ specific needs. In response to recognizing EMP students’ needs, extensive corpus-based research has led to specialized medical wordlists (Chen and Ge 2007; Wang, Liang, Ge 2008; Mungra and Canziani 2013; Hsu 2013; Lei and Liu 2016). Such wordlists have given instructors the opportunity to focus on specific vocabulary facil- itating domain s…
Tulkošanas stratēģijas Valsts Centrālās bankas gada pārskata ievadā
2020
Finanšu tulkošana ir ļoti sarežģīts un augsti pieprasīts mūsdienās specializētās tulkošanas veids, kura kvalitāte ir cieši saistīta ar pareizu tulkošanas stratēģiju un rīku izvēli. Lai identificētu tulkošanas pieejas un stratēģijas, kas ir ieteicamās konkrētajā specializētās valodas apakš-žanrā, ir svarīgi izanalizēt labākus šī apakš-žanra tulkojumus. Šī maģistra darba mērķis – ir izpētīt tulkošanas stratēģijas, kas ir visbiežāk pielietotās konkrētā finanšu tulkojumu apakš-žanrā – Valsts Centrālās bankas gada pārskata ievadā. Pētāmo tekstu korpuss tika sastādīts no tādu valsts banku un starptautisko finanšu institūciju kā LB, CBR, ECB un EBRD gada pārskatiem, laika periodā no 2009. līdz 201…
Aplicaciones lexicográficas de un corpus de discurso turístico: contextos de uso y definiciones
2012
En este artículo se propone, como punto de partida, la elaboración de un corpus de discurso turístico, incluido en una base de datos informática diseñada para tal efecto. En una segunda etapa, se analiza, cómo se contextualizan y usan los términos relativos a la tipología de habitaciones en las páginas web de promoción de hoteles, y si se ajustan o no a la definición que de ellos se ofrece en normativas y diccionarios. Esta metodología de trabajo permitirá, entre otros, diseñar futuros glosarios de promoción hotelera que recojan en las definiciones de los términos todos los matices de significado y notas de uso que sean útiles y adecuadas a los posibles destinatarios del glosario. De este m…
Faire déguster et parler de son vin pour le faire aimer et le vendre : quelques stratégies dans des interactions producteur-client
2015
International audience; Cette contribution, qui s’inscrit dans le projet global OenoLex Bourgogne, vise une analyse discursive d’interactions authentiques entre des professionnels bourguignons du vin et des clients (potentiels) en contexte de dégustation. Elle présente le corpus original produit dans le cadre du projet et met l’accent sur les stratégies de transmission de connaissancestechniques et sur les argumentaires de vente développés par les producteurs et/ou vendeurs