Search results for "klusterointi"

showing 10 items of 12 documents

ExtMiner : Combining multiple ranking and clustering algorithms for structured document retrieval

2006

This paper introduces ExtMiner, a platform and potential tool for information management in SMEs (small & medium-size enterprise), or for organizational workgroups. ExtMiner supports interactive and iterative clustering of documents. It provides users with a visual cluster and list views at the same time, supporting iterative search process. ExtMiner may also be applied as a platform for research on retrieval fusion, since it combines search, clustering and visualization algorithms. ExtMiner was evaluated with three document collections. Although the findings were encouraging the user interface and performance with large document repositories need further development. peerReviewed

Information managementdokumenttien hakumenetelmätklusterointiDocument retrievalInformation retrievalComputer scienceDocument clusteringXMLcomputer.software_genreRanking (information retrieval)document clusteringRankingHuman–computer information retrievalRelevance (information retrieval)Data miningUser interfaceDocument retrievalCluster analysiscomputer

researchProduct

Kansainvälisten koulutusarvioiden vertailu koulutuksellisen tiedonlouhinnan keinoin

2016

Koulutusta ja eri ikäisten lasten akateemista suorituskykyä mittaavat tutkimustulokset ovat kiinnostavaa tarkasteltavaa monien alojen työntekijöille ja tutkijoille. Nykyään monet organisaatiot, kuten OECD (Organisation for Economic Co-operation and Development) ja IEA (International Association for the Evaluation of Educational Achievement), järjestävät tietyin aikavälein kansainvälisiä mittauksia, joissa mitataan tietyn ikäisten lasten akateemisia kykyjä ja kysellään heidän elämästään koulussa ja kotona. Näistä mittauksista syntyvät tietokannat ovat suuria ja ne tarjoavat monipuolista tietoa koulutuksesta ja lasten oppimiseen vaikuttavista tekijöistä. Kaiken tämän lisäksi, nämä tietokannat…

PIRLSklusterointiPISA-tutkimusk-meanskoulutuksellinen tiedonlouhintaPISAklusterianalyysitiedonlouhintaTIMSS

researchProduct

Tonaaliset rakenteet Nightwish-yhtyeen musiikissa

2007

hierarkkinen klusterointiklusteritheavy rocksimilariteettimatriisirocktonaalisuusNightwish (yhtye)

researchProduct

Tiedonlouhinta rakenteisista dokumenteista

2005

Tutkielman kokonaistavoite on vastata tietotulvan tuomiin haasteisiin tiedonlouhinnan tekniikoita käyttäen. Yleisenä tutkimuskohteena on tiedonlouhinta rakenteisista dokumenteista. Täsmällisemmin määriteltynä tutkimusongelma käsittää samaa skeemaa noudattavien XML-dokumenttien klusteroinnin ja tiedonhaun. Lisäksi käsitellään erilaisten haku- ja klusterointitekniikoiden yhdistämisen tuomia mahdollisuuksia dokumenttikokoelmien hahmottamisessa. Teoreettisessa osuudessa käydään läpi erilaisia indeksirakenteita, samanlaisuusmittoja, klusterointialgoritmeja ja hakumenetelmiä. Empiirisessä osuudessa on kehitetty ExtMiner-sovellus, joka tukee hakua, klusterointia ja visualisointia erilaisille XML-d…

klusteritdokumenttien klusterointimonimuuttujamenetelmäthakuohjelmattekstitietokannattiedonhakujärjestelmättiedonlouhintaXMLtiedonhakubibliometriikka

researchProduct

Koneoppiminen

2015

Koneoppiminen on monipuolinen ja tehokas työkalu erilaisiin tehtäviin. Tässä tutkielmassa on tarkoituksena tutustua sekä ohjatun että ohjaamattoman oppimisen yleisimpiin menetelmiin. Tarkoituksena on käsitellä nämä menetelmät yleisellä tasolla niin, että asiasta tietämätön ymmärtää perusperiaatteet miten eri menetelmät toimivat. Tarkempia yksityiskohtia ja matemaattisia algoritmejä ei tulla käsittelemään. Machine learning is powerfull and versatile tool for a multitude of tasks. The point of this study is to familiarize oneself with a couple of different methods of both supervised and unsupervised machine learning, so that anyone can understand the basic principles behind the different meth…

klusterointiKoneoppiminenadaptive resonance theoryohjaamaton oppiminenohjattu oppiminenneuroverkotit- seorganisoituvat kartatart

researchProduct

Melua mittaavan langattoman anturiverkon klusterointi

2015

Langattomat anturiverkot soveltuvat moniin eri käyttötarkoituksiin, mutta anturisolmujen niukat resurssit asettavat kuitenkin omat haasteensa. Erityisesti anturisolmujen energiaa tulisi säästää, jotta verkon elinikä olisi mahdollisimman pitkä. Energiankulutusta voidaan vähentää jakamalla anturisolmut ryhmiin, klustereihin. Klusterointiprotokollan suoritus tapahtuu kierroksittain sisältäen yleensä seuraavat neljä vaihetta: pääsolmun valinta, klusterin muodostus, datan kokoaminen ja tiedonsiirto. Klusterointiprotokollan valinta voi olla haastavaa, sillä valintaan vaikuttaa monet tekijät. Klusterointiprotokollalle asetetut tavoitteet vaihtelevat ja ne määräytyvät usein sovelluksen vaatimusten …

klusterointiMH-LEACHDSBCAlangaton anturiverkkomelu

researchProduct

Exploring the differences of Finnish students in PISA 2003 and 2012 using educational data mining

2016

Suomi on aina saanut hyviä tuloksia PISA-tutkimuksissa, mutta vuonna 2012 tulokset huononivat merkittävästi. Vuosien 2003 ja 2012 aineistoihin sovellettiin muokattua tiedonlouhinta-algoritmia nimeltään k-means++. Tuloksena saatiin kummallekin aineistolle viisi klusteria, joita vertailtiin keskenään. Huonommin pärjänneet klusterit olivat pysyneet samankaltaisina, mutta paremmin pärjänneiden klusteri oli jakautunut. Lisäksi keskiverrosti pärjänneiden klusteri oli kasvanut huomattavasti. Kaikkien klustereiden tulokset matematiikassa olivat laskeneet vuodesta 2003. Finland has always gotten good scores in PISA studies, but in 2012 the results dropped signiﬁcantly. A modiﬁed version of a data mi…

klusterointiPISA-tutkimusPISAklusterianalyysitiedonlouhintak-means++

researchProduct

ProcMiner: Advancing Process Analysis and Management

2007

This paper contributes both to research and practice on process mining. Previous research on process mining has focused on mining patterns from event log files to generate process models. The process mining approach adopted in this paper is focused on producing patterns about process models, not the models themselves. The approach is demonstrated by ProcMiner -an explorative research prototype for management, consolidating, publishing, retrieving, and analyzing process models. Content-based document clustering is applied to process models represented as XML database in order to find topical groups from models. In practice, organizations face numerous challenges in managing their process mod…

klusterointiProcess modelingprosessitiedon analysontiEvent (computing)Computer sciencecomputer.internet_protocolprocess miningProcess miningDocument clusteringXMLcomputer.software_genreData scienceprosessijohtaminendocument clusteringConsistency (database systems)XML databaseQuality management systemprosessien hallintacomputerXML

researchProduct

Knowledge mining using robust clustering

2006

FM Sami Äyrämö tutki väitöstyössään suurten digitaalisten tietomassojen tehokasta hyödyntämistä ja siihen sovellettavia laskennallisesti älykkäitä niin kutsuttuja tiedonlouhintamenetelmiä (data mining). Aihe on ajankohtainen, sillä informaatiojärjestelmien nopea kehittyminen ja yleistyminen johtavat entistä useammin ”datatulvaan": digitaalisessa muodossa kerätään tietoa niin paljon, että oleellinen informaatio voi hukkua epäoleellisen ja moninkertaisen tiedon sekaan.Väitöstyönsä päätuloksena Äyrämö esittelee luotettavan, laskennallisesti tehokkaan ja käyttäjälle yksinkertaisen klusterointimenetelmän, joka ei ota kantaa sovelluskohteeseen ja on siten hyvin yleiskäyttöinen. Menetelmän pohjana…

klusterointiklusterittietovarastottiedonhallintatiedonlouhintatietojenkäsittely

researchProduct

Research literature clustering using diffusion maps

2013

We apply the knowledge discovery process to the mapping of current topics in a particular field of science. We are interested in how articles form clusters and what are the contents of the found clusters. A framework involving web scraping, keyword extraction, dimensionality reduction and clustering using the diffusion map algorithm is presented. We use publicly available information about articles in high-impact journals. The method should be of use to practitioners or scientists who want to overview recent research in a field of science. As a case study, we map the topics in data mining literature in the year 2011. peerReviewed

ta113kirjallisuuskatsausklusterointiComputer scienceProcess (engineering)Dimensionality reductiondiffuusiokuvausta111Diffusion mapKeyword extractionliterature mappingdiffusion mapKnowledge discovery processLibrary and Information Sciencescomputer.software_genreData scienceField (geography)Computer Science ApplicationsKnowledge extractionTiedonhavaitsemisprosessitiedonlouhintaCluster analysiscomputerWeb scrapingclustering

researchProduct