0000000000022164

AUTHOR

Lucile Sautot

0000-0002-4204-7427

showing 26 related works from this author

Enrichissement de schéma multidimensionnel en constellation grâce à la Classification Ascendante Hiérarchique

2016

National audience; Les hiérarchies sont des structures cruciales dans un entrepôt de don-nées puisqu'elles permettent l'agrégation de mesures dans le but de proposer une vue analytique plus ou moins globale sur les données entreposées, selon le niveau hiérarchique auquel on se place. Cependant, peu de travaux s'intéressent à la construction de hiérarchies, via un algorithme de fouille de données, pre-nant en compte le contexte multidimensionnel de la dimension concernée. Dans cet article, nous proposons donc un algorithme, implémenté sur une architecture ROLAP, permettant d'enrichir une dimension avec des données factuelles.

[ INFO.INFO-DB ] Computer Science [cs]/Databases [cs.DB]OLAP[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB][INFO.INFO-DB] Computer Science [cs]/Databases [cs.DB]classification ascendante hiérarchiqueentrepôts de données
researchProduct

Une nouvelle approche mixte d'enrichissement de dimensions dans un schéma multidimensionnel en constellation Application à la biodiversité des oiseaux

2015

International audience; Les entrepôts de données (DW) et les systèmes OLAP sont des technologies d'analyse en ligne pour de grands volumes de données, basés sur les be-soins des utilisateurs. Leur succès dépend essentiellement de la phase de conception où les exigences fonctionnelles sont confrontées aux sources de données (méthodologie de conception mixte). Cependant, les méthodes de conception existantes semblent parfois inefficaces, lorsque les décideurs définissent des exi-gences fonctionnelles qui ne peuvent être déduites à partir des sources de don-nées (approche centrée sur les données), ou lorsque le décideur n'a pas intégré tous ces besoins durant la phase de conception (approche c…

Multidimensional design[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI][SDE] Environmental Sciences[ INFO.INFO-IR ] Computer Science [cs]/Information Retrieval [cs.IR]Data Warehouse[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB]OLAPBiodiversity[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI][ SDE ] Environmental Sciences[ INFO.INFO-DB ] Computer Science [cs]/Databases [cs.DB][INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR][SDE]Environmental Sciences[INFO.INFO-DB] Computer Science [cs]/Databases [cs.DB][INFO.INFO-IR] Computer Science [cs]/Information Retrieval [cs.IR][ INFO.INFO-AI ] Computer Science [cs]/Artificial Intelligence [cs.AI]Data mining
researchProduct

The Hierarchical Agglomerative Clustering with Gower index: a methodology for automatic design of OLAP cube in ecological data processing context

2015

In Press, Corrected Proof; International audience; The OLAP systems can be an improvement for ecological studies. In fact, ecology studies, follows and analyzes phenomenon across space and time and according to several parameters. OLAP systems can provide to ecologists browsing in a large dataset. One focus of the current research on OLAP system is the automatic design of OLAP cubes and of data warehouse schemas. This kind of works makes accessible OLAP technology to non information technology experts. But to be efficient, the automatic OLAP building must take into account various cases. Moreover the OLAP technology is based on the concept of hierarchy. Thereby the hierarchical clustering m…

[ INFO.INFO-NA ] Computer Science [cs]/Numerical Analysis [cs.NA]Computer scienceContext (language use)02 engineering and technologycomputer.software_genre020204 information systems0202 electrical engineering electronic engineering information engineeringDimension (data warehouse)Cluster analysisEcology Evolution Behavior and Systematics[ SDE.BE ] Environmental Sciences/Biodiversity and Ecology[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB]OLAPEcologyAutomatic designApplied MathematicsEcological ModelingOnline analytical processing[ STAT.AP ] Statistics [stat]/Applications [stat.AP]InformationSystems_DATABASEMANAGEMENTHierarchical agglomerative clustering[INFO.INFO-NA]Computer Science [cs]/Numerical Analysis [cs.NA]Missing dataData warehouseComputer Science ApplicationsHierarchical clustering[ INFO.INFO-DB ] Computer Science [cs]/Databases [cs.DB]Computational Theory and MathematicsModeling and SimulationOLAP cube020201 artificial intelligence & image processingData mining[SDE.BE]Environmental Sciences/Biodiversity and EcologyBird populationcomputer
researchProduct

Semi-automatic conception and implementation of data warehouses : application to ecological data

2015

This thesis concerns the semi-automatic design of data warehouses and the associated OLAP cubes analyzing ecological data.The biological sciences, including ecology and agronomy, generate data that require an important collection effort: several years are often required to obtain a complete data set. Moreover, objects and phenomena studied by these sciences are complex and require many parameter recording to be understood. Finally, the collection of complex data over a long time results in an increased risk of inconsistency. Thus, these sciences generate numerous and heterogeneous data, which can be inconsistent. It is interesting to offer to scientists, who work in life sciences, informati…

OLAPConception automatique[INFO.INFO-DB] Computer Science [cs]/Databases [cs.DB]Entrepôt de donnéesPrototypageBiodiversité
researchProduct

Construction de Modèles Prédictifs pour l'Analyse des Relations Oiseaux-Paysage

2013

National audience; Cet article présente une comparaison de trois méthodes (Modèles Linéaires Généralisés, Réseaux de Neurones, Machines Vecteurs Supports) et de différentes combinaisons de prétraitements de données (filtrage, arrondi, analyse factorielle, sélection de paramètres). L'objectif de cette comparaison est de définir quel est le processus qui permet de construire le meilleur modèle prédictif, dans le cadre de la prédiction d'abondances d'espèces d'oiseaux à partir de variables décrivant le paysage. Nous comparerons les modèles grâce à l'erreur moyenne absolue et à l'information mutuelle. Cette comparaison a montré qu'aucune technique étudiée ne permet de construire des modèles pré…

[ SDV.BID ] Life Sciences [q-bio]/Biodiversity[SPI]Engineering Sciences [physics]relations espèces-environnement[STAT.ML]Statistics [stat]/Machine Learning [stat.ML][SPI] Engineering Sciences [physics][ SPI ] Engineering Sciences [physics]oiseauxdata mining[SDV.BID]Life Sciences [q-bio]/Biodiversity[ STAT.ML ] Statistics [stat]/Machine Learning [stat.ML][STAT.ML] Statistics [stat]/Machine Learning [stat.ML][SDV.BID] Life Sciences [q-bio]/Biodiversitymodélisation
researchProduct

Efficient unsupervised clustering for spatial bird population analysis along the Loire river

2015

International audience; This paper focuses on application and comparison of Non Linear Dimensionality Reduction (NLDR) methods on natural high dimensional bird communities dataset along the Loire River (France). In this context, biologists usually use the well-known PCA in order to explain the upstream-downstream gradient.Unfortunately this method was unsuccessful on this kind of nonlinear dataset.The goal of this paper is to compare recent NLDR methods coupled with different data transformations in order to find out the best approach. Results show that Multiscale Jensen-Shannon Embedding (Ms JSE) outperform all over methods in this context.

Clustering Algorithms[ INFO.INFO-TS ] Computer Science [cs]/Signal and Image Processing[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing[INFO.INFO-TS] Computer Science [cs]/Signal and Image ProcessingNonlinear dimension reductionMultiscale Jensen-Shannon EmbeddingDimension ReductionLoire River
researchProduct

Nombre de contributions en ligne au Grand Débat National (volet Transition Écologique) en France métropolitaine

2019

Les données extraites pour cette analyse proviennent du site du Grand Débat National. Nous avons utilisé les données concernant la transition écologique. Sur l’ensemble de ces données seul ont été considérée celle faisant référence aux réponses aux propositions et pas aux questionnaires rapides. Nous utilisons les codes postaux renseignés par les contributeurs dans leurs propositions. Parmi les 134177 personnes ayant répondu au questionnaire "Transition écologique", 131472 ont donné un code postal exploitable permettant de les localiser. La carte montre le nombre de contributeurs répartis dans une maille hexagonale, où le centre de chaque maille est distant de dix kilomètres de ses voisins.…

[SHS.INFO]Humanities and Social Sciences/Library and information sciencestransition écologiqueGrand Débat National[SHS.SCIPO] Humanities and Social Sciences/Political science[SHS.SCIPO]Humanities and Social Sciences/Political science[SHS.INFO] Humanities and Social Sciences/Library and information sciences
researchProduct

Contributeurs au Grand Débat National demandant un développement des pistes cyclables dans l'Hérault

2021

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI]Pistes cyclables[SHS.GEO] Humanities and Social Sciences/GeographyGrand débat national[SHS.GEO]Humanities and Social Sciences/Geography[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Mixed Driven Refinement Design of Multidimensional Models based on Agglomerative Hierarchical Clustering

2015

20 pages; International audience; Data warehouses (DW) and OLAP systems are business intelligence technologies allowing the on-line analysis of huge volume of data according to users' needs. The success of DW projects essentially depends on the design phase where functional requirements meet data sources (mixed design methodology) (Phipps and Davis, 2002). However, when dealing with complex applications existing design methodologies seem inefficient since decision-makers define functional requirements that cannot be deduced from data sources (data driven approach) and/or they have not sufficient application domain knowledge (user driven approach) (Sautot et al., 2014b). Therefore, in this p…

[SDE] Environmental SciencesMultidimensional designData Warehouse[ INFO.INFO-TS ] Computer Science [cs]/Signal and Image ProcessingOLAPbusiness.industryComputer scienceOnline analytical processingCLUSTERING HIERARCHIQUEVolume (computing)Functional requirementcomputer.software_genreData warehouseData-driven[INFO.INFO-TS]Computer Science [cs]/Signal and Image ProcessingApplication domain[SDE]Environmental SciencesBusiness intelligenceData MiningData mining[SDE.BE]Environmental Sciences/Biodiversity and EcologybusinessDesign methodscomputerProceedings of the 17th International Conference on Enterprise Information Systems
researchProduct

Le grand débat national, une aide pour prendre des décisions locales?

2021

The Great National Debate, decided by Emmanuel Macron at the beginning of 2019 to respond to the Yellow Vests social movement, allowed the collection of citizens’ contributions on the ecological transition via an online platform. In this article, we use the corpus constituted by these contributions to identify areas where participants are asking for the development of bicycle paths and railway facilities. For this purpose, we have created a classification model to identify contributions dealing with the theme of transportation and proposed a method for extracting patterns that reflect the contributors’ proposals. We then represented these patterns on maps, using the contributors’ postal cod…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI]ACM: I.: Computing Methodologies/I.2: ARTIFICIAL INTELLIGENCE/I.2.7: Natural Language Processing/I.2.7.0: DiscourseMotifs[SHS.GEO] Humanities and Social Sciences/GeographyGrand Débat NationalTransport[SHS.GEO]Humanities and Social Sciences/GeographyPatternsACM: I.: Computing Methodologies/I.2: ARTIFICIAL INTELLIGENCE/I.2.7: Natural Language Processing[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Contributeurs au Grand Débat National demandant un développement du réseau ferroviaire et/ou une augmentation de la fréquence des trains dans l'Hérau…

2021

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI][SHS.GEO] Humanities and Social Sciences/GeographyGrand débat nationalVoie ferrée[SHS.GEO]Humanities and Social Sciences/GeographyTrain[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Contributeurs au Grand Débat National demandant un développement du réseau ferroviaire et/ou une augmentation de la fréquence des trains dans l'aire …

2020

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI][SHS.GEO] Humanities and Social Sciences/GeographyGrand débat nationalVoie ferréecorpus[SHS.GEO]Humanities and Social Sciences/GeographyTrain[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Qui a peur du changement climatique?

2019

ABSTRACT.The French "Grand Débat National" (Great National Debate) was animportant political event in 2019. Using the online proposals collected during thisconsultation, we propose a representation of the feeling of the impact of climate changeamong the contributors to the "Grand Débat National" in Metropolitan France. Weanalyze the causes of this feeling, through a supervised analysis of the contributions(via the Great Annotation) and we show the complementary interest of an unsuper-vised analysis (by extracting keywords). We show the richness of the data set that constitutes the "Grand Débat National", and the analytical stakes around these data.We also point out some important limitation…

Changement climatique[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing[SHS.GEO] Humanities and Social Sciences/GeographyGlobal warmingGrand Débat National[INFO.INFO-TT] Computer Science [cs]/Document and Text Processing[SHS.GEO]Humanities and Social Sciences/Geographyrand Débat NationalComputingMilieux_MISCELLANEOUS
researchProduct

Constitution de corpus thématique : Pour un meilleur suivi du territoire de la Métropole de Montpellier Méditerranée

2021

International audience

[SDE] Environmental Sciences[SDE]Environmental Sciences[INFO]Computer Science [cs][INFO] Computer Science [cs]ComputingMilieux_MISCELLANEOUS
researchProduct

Contributeurs au Grand Débat National demandant un développement du réseau ferroviaire et/ou une augmentation de la fréquence des trains dans l'aire …

2020

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI][SHS.GEO] Humanities and Social Sciences/GeographyGrand débat nationalVoie ferrée[SHS.GEO]Humanities and Social Sciences/GeographyTrain[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Multidimensional Model Design using Data Mining: A Rapid Prototyping Methodology

2017

[Departement_IRSTEA]Ecotechnologies [TR1_IRSTEA]MOTIVE; International audience; Designing and building a Data Warehouse (DW), and associated OLAP cubes, are long processes, during which decision-maker requirements play an important role. But decision-makers are not OLAP experts and can find it difficult to deal with the concepts behind DW and OLAP. To support DW design in this context, we propose: (i) a new rapid prototyping methodology, integrating two different DM algorithms, to define dimension hierarchies according to decision-maker knowledge; (ii) a complete UML Profile, to define a DW schema that integrates both the DM algorithms; (iii) a mapping process to transform multidimensional …

Rapid prototypingData WarehouseUml ProfileComputer scienceEvolution02 engineering and technologycomputer.software_genreData WarehousesMethodologies and Tools020204 information systemsSchema (psychology)0202 electrical engineering electronic engineering information engineeringData Mining[INFO]Computer Science [cs]Conceptual-ModelOLAPOnline analytical processingInformationSystems_DATABASEMANAGEMENTUml profileClassificationData warehouseMultidimensional modelSupport vector machineHardware and Architecture020201 artificial intelligence & image processingData miningcomputerSupport-Vector-MachineSoftware
researchProduct

Le sentiment des contributeurs de l’impact du changement climatique sur leur vie quotidienne (contributions en ligne au Grand Débat National - volet …

2019

Les données extraites pour cette analyse proviennent du site du Grand Débat National -volet Transition écologique.Nous utilisons les codes postaux renseignés par les contributeurs dans leurs propositions. Parmi les 134177 personnes ayant répondu au questionnaire "Transition écologique", 131472 ont donné un code postal exploitable permettant de les localiser.Concernant la question "Diriez-vous que votre vie quotidienne est aujourd’hui touchée par le changement climatique ?", 64% des contributeurs ont répondu oui, 29% ont répondu non et 7% n’ont pas répondu.Pour représenter le sentiment d’impact du changement climatique, nous exprimons ce dernier par un indice de sentiment estimer par la rela…

changement climatiqueclimate changesentiment[SHS.INFO]Humanities and Social Sciences/Library and information sciencesGrand Débat Nationalfeeling[SHS.SCIPO] Humanities and Social Sciences/Political science[SHS.SCIPO]Humanities and Social Sciences/Political science[SHS.INFO] Humanities and Social Sciences/Library and information sciences
researchProduct

Enrichissement de schéma multidimensionnel en constellation grâce à la classification ascendante hiérarchique

2016

International audience; Les hiérarchies sont des structures cruciales dans un entrepôt de données puisqu’elles permettent l’agrégation de mesures dans le but de proposer une vue analytique plus ou moins globale sur les données entreposées, selon le niveau hiérarchique auquel on se place. Cependant, peu de travaux s’intéressent à la construction de hiérarchies, via un algorithme de fouille de données, prenant en compte le contexte multidimensionnel de la dimension concernée. Dans cet article, nous proposons donc un algorithme, implémenté sur une architecture ROLAP, permettant d’enrichir une dimension avec des données factuelles.

[SDE] Environmental Sciences[SDE]Environmental Sciences
researchProduct

Large-scale nonlinear dimensionality reduction for network intrusion detection

2017

International audience; Network intrusion detection (NID) is a complex classification problem. In this paper, we combine classification with recent and scalable nonlinear dimensionality reduction (NLDR) methods. Classification and DR are not necessarily adversarial, provided adequate cluster magnification occurring in NLDR methods like $t$-SNE: DR mitigates the curse of dimensionality, while cluster magnification can maintain class separability. We demonstrate experimentally the effectiveness of the approach by analyzing and comparing results on the big KDD99 dataset, using both NLDR quality assessment and classification rate for SVMs and random forests. Since data involves features of mixe…

intrusion detection[INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV][ SPI.SIGNAL ] Engineering Sciences [physics]/Signal and Image processing[INFO.INFO-LG] Computer Science [cs]/Machine Learning [cs.LG][ INFO.INFO-CV ] Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV][ INFO.INFO-LG ] Computer Science [cs]/Machine Learning [cs.LG][STAT.ML] Statistics [stat]/Machine Learning [stat.ML][INFO.INFO-CV] Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV]ComputingMethodologies_PATTERNRECOGNITION[STAT.ML]Statistics [stat]/Machine Learning [stat.ML][INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]Gower[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing[ STAT.ML ] Statistics [stat]/Machine Learning [stat.ML][SPI.SIGNAL] Engineering Sciences [physics]/Signal and Image processingdimensionality reduction
researchProduct

Dimension enrichment with factual data during the design of multidimensional models: application to bird biodiversity

2015

20 pages; International audience; Data warehouses (DW) and OLAP systems are technologies allowing the on-line analysis of huge volume of data according to decision-makers’ needs. Designing DW involves taking into account functional requirements and data sources (mixed design methodology) [1]. But, for complex applications, existing automatic design methodologies seem inefficient. In some cases, decision-makers need querying, as a dimension, data which have been defined as facts by actual automatic mixed approachs. Therefore, in this paper, we offer a new mixed refinement methodology relevant to constellation multidimensional schema. The proposed methodolgy allows to decision-makers to enric…

Multidimensional design[SDE] Environmental SciencesComputer science0102 computer and information sciences02 engineering and technologycomputer.software_genre01 natural sciencesData warehouseSchema (psychology)0202 electrical engineering electronic engineering information engineeringDesign methodsData miningConstellation[ SDE.BE ] Environmental Sciences/Biodiversity and Ecology[STAT.AP]Statistics [stat]/Applications [stat.AP]OLAPOnline analytical processing[ STAT.AP ] Statistics [stat]/Applications [stat.AP]Functional requirementData warehouse010201 computation theory & mathematics[SDE]Environmental Sciences020201 artificial intelligence & image processingData miningMultidimensional design[SDE.BE]Environmental Sciences/Biodiversity and Ecologycomputer
researchProduct

Contributeurs au Grand Débat National demandant un développement des pistes cyclables dans l'aire urbaine de Grenoble

2020

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI][SHS.GEO] Humanities and Social Sciences/GeographyGrand débat nationalVoie ferrée[SHS.GEO]Humanities and Social Sciences/GeographyCorpusPiste cyclable[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

Mesurer l’efficacité des enseignements par l’étude des rendements

2021

International audience; Le champ des recherches concernant les pratiques enseignantes en étude de la langue demeure peu fertile (on citera entre autres : Bulea Bronckart et al. , 2018 ; Riou, 2017) et supporte peu de généralisations, la portée statistique semblant difficilement atteignable, pour des raisons pragmatiques. Par ailleurs, l’importante recherche Lire – Écrire menée par l’Ifé en 2010-2013 (Goigoux, 2015) a ouvert la voie méthodologique à des études quantitatives dans le domaine de la didactique. C’est dans ce cadre que la recherche REAlang1 s’est donné comme objectif, entre autres, d’évaluer la performance des classes de CE2, CM1 et CM22 concernant des savoirs grammaticaux et ort…

Apprentissage - enseignementcorpus[SHS.LANGUE]Humanities and Social Sciences/Linguistics[SHS.LANGUE] Humanities and Social Sciences/Linguistics
researchProduct

Une méthodologie et un outil pour le prototypage rapide des entrepôts de données en utilisant le data mining : application à la biodiversité des oise…

2014

International audience; Data Warehouses (DWs) are large repositories of data aimed at supporting the decision-making process by enabling flexible and interactive analyses via OLAP systems. Rapid prototyping of DWs is necessary when OLAP applications are complex. Some work about the integration of Data Mining and OLAP systems has been done to enhance OLAP operators with mined indicators, and/or to define the DW schema. However, to best of our knowledge, prototyping methods for DWs do not support this kind of integration. Then, in this paper we present a new prototyping methodology for DWs, extending [3], where DM methods are used to define the DW schema. We validate our approach on a real da…

[SDE] Environmental Sciences[ INFO.INFO-DB ] Computer Science [cs]/Databases [cs.DB]OLAP[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB]Rapid prototypingInformationSystems_DATABASEMANAGEMENTOLAMiningData Warehouse design
researchProduct

Contributeurs au Grand Débat National demandant un développement des pistes cyclables dans l'aire urbaine de Dijon

2020

Le Grand Débat National, décidé par Emmanuel Macron début 2019 pour répondre au mouvement social des Gilets Jaunes, a permis de collecter les contributions de citoyens sur la transition écologique via une plateforme en ligne. Dans cet article, nous exploitons le corpus constitué par ces contributions pour identifier des zones où les participants demandent le développement de pistes cyclables et d’équipements ferroviaires. Pour cela, nous avons créé un modèle de classification permettant d’identifier les contributions traitant de la thématique du transport et proposé une méthode d’extraction de motifs traduisant les propositions des contributeurs. A l’aide des codes postaux donnés par les co…

[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI]Pistes cyclables[SHS.GEO] Humanities and Social Sciences/GeographyGrand débat national[SHS.GEO]Humanities and Social Sciences/Geography[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]
researchProduct

A Methodology and Tool for Rapid Prototyping of Data Warehouses Using Data Mining: Application to Birds Biodiversity

2014

Data Warehouses (DWs) are large repositories of data aimed at supporting the decision-making process by enabling flexible and interactive analyses via OLAP systems. Rapid prototyping of DWs is necessary when OLAP applications are complex. Some work about the integration of Data Mining and OLAP systems has been done to enhance OLAP operators with mined indicators, and/or to define the DW schema. However, to best of our knowledge, prototyping methods for DWs do not support this kind of integration. Then, in this paper we present a new prototyping methodology for DWs, extending [3], where DM methods are used to define the DW schema. We validate our approach on a real data set concerning bird b…

Rapid prototypingDatabaseComputer scienceOnline analytical processingSchema (psychology)InformationSystems_DATABASEMANAGEMENTData miningcomputer.software_genrecomputerData warehouse
researchProduct

The Tucker tensor decomposition for data analysis: capabilities and advantages

2022

Tensors are powerful multi-dimensional mathematical objects, that easily embed various data models such as relational, graph, time series, etc. Furthermore, tensor decomposition operators are of great utility to reveal hidden patterns and complex relationships in data. In this article, we propose to study the analytical capabilities of the Tucker decomposition, as well as the differences brought by its major algorithms. We demonstrate these differences through practical examples on several datasets having a ground truth. It is a preliminary work to add the Tucker decomposition to the Tensor Data Model, a model aiming to make tensors data-centric, and to optimize operators in order to enable…

tensor decompositionTucker[INFO.INFO-NA] Computer Science [cs]/Numerical Analysis [cs.NA]data analysistensor
researchProduct