0000000000880130

AUTHOR

Abdelghani Laifa

showing 2 related works from this author

Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support

2020

International audience; Cet article présente des travaux visant à développer un système de rédaction automatique de résumés de textes économiques et financiers en attachant une attention particulière à l’idiomaticité et à la fluidité de la langue d’arrivée. Pour ce faire, l’étude part d’un corpus de rapports périodiques de la Banque de France relevant des discours de conjoncture. Le travail linguistique permet de montrer qu’une rédaction des résumés ne s’attachant qu’à l’extraction terminologique et collocationnelle stricte ignore tout un pan de vocabulaire, saisi ici comme « lexique support », jouant un rôle important dans l’organisation cognitive du domaine. Sur cette base, le travail pré…

Plongement de motsCommunication financièreTraitement automatique de la langueRésumé automatiqueLinguistique de corpus[SHS.LANGUE]Humanities and Social Sciences/LinguisticsCorpusTerminologiePatterns[SHS.LANGUE] Humanities and Social Sciences/LinguisticsTraitement automatique des languesFinanceFigement
researchProduct

Impact of textual data augmentation on linguistic pattern extraction to improve the idiomaticity of extractive summaries

2021

International audience; The present work aims to develop a text summarisation system for financial texts with a focus on the fluidity of the target language. Linguistic analysis shows that the process of writing summaries should take into account not only terminological and collocational extraction, but also a range of linguistic material referred to here as the "support lexicon", that plays an important role in the cognitive organisation of the field. On this basis, this paper highlights the relevance of pre-training the CamemBERT model on a French financial dataset to extend its domainspecific vocabulary and fine-tuning it on extractive summarisation. We then evaluate the impact of textua…

VocabularyProcess (engineering)Computer sciencemedia_common.quotation_subjectLinguistic PatternsDeep learning02 engineering and technologyLexiconTerminology[SHS.LANGUE] Humanities and Social Sciences/LinguisticsLinguisticsField (computer science)Focus (linguistics)TerminologyText summarisationCorpus linguistics0202 electrical engineering electronic engineering information engineeringCorpus Linguistics020201 artificial intelligence & image processingRelevance (information retrieval)[SHS.LANGUE]Humanities and Social Sciences/Linguisticsmedia_commonNatural Language Processing
researchProduct