6533b830fe1ef96bd1297821

RESEARCH PRODUCT

Modèle tensoriel pour l'entreposage et l'analyse des données des réseaux sociaux Application à l'étude de la viralité sur Twitter

Eric LeclercqMarinette Savonnet

subject

[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB]multi-relational networkpolyglot storage[INFO.INFO-SI] Computer Science [cs]/Social and Information Networks [cs.SI][INFO.INFO-DB] Computer Science [cs]/Databases [cs.DB][INFO.INFO-SI]Computer Science [cs]/Social and Information Networks [cs.SI]tensor

description

International audience; Dans cet article, nous montrons comment la notion de tenseur permet de construire un modèle multi-paradigmes pour l'entreposage des données sociales. D'un point de vue architecture , cette approche permet de lier différents systèmes de stockage (polystore) et de limiter l'impact des outils ETL réalisant les transformations de modèles pour alimenter différents al-gorithmes d'analyse. Ainsi, le modèle proposé permet d'assurer l'indépendance logique entre les données et les programmes implantant les algorithmes d'analyse. Avec un cas concret ex-trait d'une étude de la viralité sur Twitter durant la période de l'entre deux tours de l'élection présidentielle française de 2017, nous mettons en évidence les apports de notre modèle. ABSTRACT. In this article, we show how the notion of tensor can be used to build a multi-paradigm model for the storage of social data. From an architectural point of view, this approach allows to link different storage systems (polystore) and thus limits the impact of ETL tools performing model transformations to feed different analysis algorithms. The proposed model allows to reach the logical independence between data and programs implementing analysis algorithms. With a concrete case study on message virality on Twitter during the period between the two rounds of the French presidential election of 2017, we highlight the contributions of our model. MOTS-CLÉS : stockage polyglotte, réseau multi-relationnel, tenseur, OLAP

https://u-bourgogne.hal.science/hal-01821102