6533b857fe1ef96bd12b5255
RESEARCH PRODUCT
Knowledge discovery from physical activity
Susanne Jauhiainensubject
klusteritcluster validation indexknowledge discoveryphysical activitytiedonlouhintafyysinen aktiivisuusdescription
Tässä pro gradu -tutkielmassa käydään läpi Knowledge Discovery in Databases (KDD) -prosessi ja sen soveltamismahdollisuuksia fyysiseen aktiivisuuteen liittyvän datan kanssa. KDD-prosessi koostuu monesta eri vaiheesta, sisältäen esikäsittelyn, datan muunnoksen ja tiedonlouhinnan. Tässä tutkielmassa tiedonlouhinnan menetelmänä käytetään klusterointia, joka käydään läpi yksityiskohtaisesti. Vertailemme myös laajan joukon eri klusterointi indeksejä (CVAIs) sekä niiden eri toteutuksia k-means klusteroinnin kanssa ja esittelemme parhaat näistä yleisemmässä muodossa. Tutkielman empiirisessä osassa seitsemäsluokkalaisten koululaisten aktiivisuusdataa tutkitaan KDD-prosessia seuraten ja hyödyntäen monia eri datan muunnoksia ja klusterointimenetelmiä. Tarkoituksena on selvittää, voiko ohjaamattoman tiedonlouhinnan avulla löytää uutta ja hyödyllistä informaatiota datasta. In this master’s thesis the Knowledge Discovery in Databases (KDD) process and its usage with physical activity data are discussed. The KDD process has multiple steps, including preprocessing, transformation, and data mining. Clustering is used as the data mining technique and is introduced in detail. A large set of different Cluster Validation Indices (CVAIs) and their implementations are tested with the k-means clustering and the best performing ones further generalized. In the empirical part, physical activity data from Finnish seventh-grade students is assessed following the KDD process and using multiple different transformations with different clustering methods. The aim is to find out, whether unsupervised data mining can help detect novel and useful information from this data.
year | journal | country | edition | language |
---|---|---|---|---|
2017-01-01 |