Search results for "klusterointi"
showing 10 items of 12 documents
ExtMiner : Combining multiple ranking and clustering algorithms for structured document retrieval
2006
This paper introduces ExtMiner, a platform and potential tool for information management in SMEs (small & medium-size enterprise), or for organizational workgroups. ExtMiner supports interactive and iterative clustering of documents. It provides users with a visual cluster and list views at the same time, supporting iterative search process. ExtMiner may also be applied as a platform for research on retrieval fusion, since it combines search, clustering and visualization algorithms. ExtMiner was evaluated with three document collections. Although the findings were encouraging the user interface and performance with large document repositories need further development. peerReviewed
Kansainvälisten koulutusarvioiden vertailu koulutuksellisen tiedonlouhinnan keinoin
2016
Koulutusta ja eri ikäisten lasten akateemista suorituskykyä mittaavat tutkimustulokset ovat kiinnostavaa tarkasteltavaa monien alojen työntekijöille ja tutkijoille. Nykyään monet organisaatiot, kuten OECD (Organisation for Economic Co-operation and Development) ja IEA (International Association for the Evaluation of Educational Achievement), järjestävät tietyin aikavälein kansainvälisiä mittauksia, joissa mitataan tietyn ikäisten lasten akateemisia kykyjä ja kysellään heidän elämästään koulussa ja kotona. Näistä mittauksista syntyvät tietokannat ovat suuria ja ne tarjoavat monipuolista tietoa koulutuksesta ja lasten oppimiseen vaikuttavista tekijöistä. Kaiken tämän lisäksi, nämä tietokannat…
Tonaaliset rakenteet Nightwish-yhtyeen musiikissa
2007
Tiedonlouhinta rakenteisista dokumenteista
2005
Tutkielman kokonaistavoite on vastata tietotulvan tuomiin haasteisiin tiedonlouhinnan tekniikoita käyttäen. Yleisenä tutkimuskohteena on tiedonlouhinta rakenteisista dokumenteista. Täsmällisemmin määriteltynä tutkimusongelma käsittää samaa skeemaa noudattavien XML-dokumenttien klusteroinnin ja tiedonhaun. Lisäksi käsitellään erilaisten haku- ja klusterointitekniikoiden yhdistämisen tuomia mahdollisuuksia dokumenttikokoelmien hahmottamisessa. Teoreettisessa osuudessa käydään läpi erilaisia indeksirakenteita, samanlaisuusmittoja, klusterointialgoritmeja ja hakumenetelmiä. Empiirisessä osuudessa on kehitetty ExtMiner-sovellus, joka tukee hakua, klusterointia ja visualisointia erilaisille XML-d…
Koneoppiminen
2015
Koneoppiminen on monipuolinen ja tehokas työkalu erilaisiin tehtäviin. Tässä tutkielmassa on tarkoituksena tutustua sekä ohjatun että ohjaamattoman oppimisen yleisimpiin menetelmiin. Tarkoituksena on käsitellä nämä menetelmät yleisellä tasolla niin, että asiasta tietämätön ymmärtää perusperiaatteet miten eri menetelmät toimivat. Tarkempia yksityiskohtia ja matemaattisia algoritmejä ei tulla käsittelemään. Machine learning is powerfull and versatile tool for a multitude of tasks. The point of this study is to familiarize oneself with a couple of different methods of both supervised and unsupervised machine learning, so that anyone can understand the basic principles behind the different meth…
Melua mittaavan langattoman anturiverkon klusterointi
2015
Langattomat anturiverkot soveltuvat moniin eri käyttötarkoituksiin, mutta anturisolmujen niukat resurssit asettavat kuitenkin omat haasteensa. Erityisesti anturisolmujen energiaa tulisi säästää, jotta verkon elinikä olisi mahdollisimman pitkä. Energiankulutusta voidaan vähentää jakamalla anturisolmut ryhmiin, klustereihin. Klusterointiprotokollan suoritus tapahtuu kierroksittain sisältäen yleensä seuraavat neljä vaihetta: pääsolmun valinta, klusterin muodostus, datan kokoaminen ja tiedonsiirto. Klusterointiprotokollan valinta voi olla haastavaa, sillä valintaan vaikuttaa monet tekijät. Klusterointiprotokollalle asetetut tavoitteet vaihtelevat ja ne määräytyvät usein sovelluksen vaatimusten …
Exploring the differences of Finnish students in PISA 2003 and 2012 using educational data mining
2016
Suomi on aina saanut hyviä tuloksia PISA-tutkimuksissa, mutta vuonna 2012 tulokset huononivat merkittävästi. Vuosien 2003 ja 2012 aineistoihin sovellettiin muokattua tiedonlouhinta-algoritmia nimeltään k-means++. Tuloksena saatiin kummallekin aineistolle viisi klusteria, joita vertailtiin keskenään. Huonommin pärjänneet klusterit olivat pysyneet samankaltaisina, mutta paremmin pärjänneiden klusteri oli jakautunut. Lisäksi keskiverrosti pärjänneiden klusteri oli kasvanut huomattavasti. Kaikkien klustereiden tulokset matematiikassa olivat laskeneet vuodesta 2003. Finland has always gotten good scores in PISA studies, but in 2012 the results dropped significantly. A modified version of a data mi…
ProcMiner: Advancing Process Analysis and Management
2007
This paper contributes both to research and practice on process mining. Previous research on process mining has focused on mining patterns from event log files to generate process models. The process mining approach adopted in this paper is focused on producing patterns about process models, not the models themselves. The approach is demonstrated by ProcMiner -an explorative research prototype for management, consolidating, publishing, retrieving, and analyzing process models. Content-based document clustering is applied to process models represented as XML database in order to find topical groups from models. In practice, organizations face numerous challenges in managing their process mod…
Knowledge mining using robust clustering
2006
FM Sami Äyrämö tutki väitöstyössään suurten digitaalisten tietomassojen tehokasta hyödyntämistä ja siihen sovellettavia laskennallisesti älykkäitä niin kutsuttuja tiedonlouhintamenetelmiä (data mining). Aihe on ajankohtainen, sillä informaatiojärjestelmien nopea kehittyminen ja yleistyminen johtavat entistä useammin ”datatulvaan": digitaalisessa muodossa kerätään tietoa niin paljon, että oleellinen informaatio voi hukkua epäoleellisen ja moninkertaisen tiedon sekaan.Väitöstyönsä päätuloksena Äyrämö esittelee luotettavan, laskennallisesti tehokkaan ja käyttäjälle yksinkertaisen klusterointimenetelmän, joka ei ota kantaa sovelluskohteeseen ja on siten hyvin yleiskäyttöinen. Menetelmän pohjana…
Research literature clustering using diffusion maps
2013
We apply the knowledge discovery process to the mapping of current topics in a particular field of science. We are interested in how articles form clusters and what are the contents of the found clusters. A framework involving web scraping, keyword extraction, dimensionality reduction and clustering using the diffusion map algorithm is presented. We use publicly available information about articles in high-impact journals. The method should be of use to practitioners or scientists who want to overview recent research in a field of science. As a case study, we map the topics in data mining literature in the year 2011. peerReviewed