Search results for "tilastotiede"
showing 10 items of 19 documents
Alkoholinkäytön aiheuttama liikennekuoleman riski Suomessa
2023
Tässä tutkimuksessa analysoidaan juopumuksen asteen vaikutusta kuolemaan johtavan liikenneonnettomuuden riskiin moderneilla tilastollisilla menetelmillä. Tutkimuksen pääaineistona ovat vuosina 2005–2014 Suomessa tapahtuneet kuolemaan johtaneet moottoriajoneuvo-onnettomuudet, joissa oli mukana henkilöauto aiheuttajana tai muuna osallisena. Pääaineistoa täydennetään ratsiatutkimuksista julkaistuilla tilastoilla. Keskeisiä käytettyjä mittareita ovat riskisuhde sekä vakioitu riskisuhde, josta on poistettu sekoittavien muuttujien vaikutusta. Tutkimuksen ensimmäisenä tavoitteena on selvittää, miten pieni veren alkoholipitoisuus alkaa lisätä liikenneonnettomuuden riskiä, ja toisena tavoitteena on …
A practical approach to improve the statistical performance of surface water monitoring networks
2019
The representativeness of aquatic ecosystem monitoring and the precision of the assessment results are of high importance when implementing the EU’s Water Framework Directive that aims to secure a good status of waterbodies in Europe. However, adapting monitoring designs to answer the objectives and allocating the sampling resources effectively are seldom practiced. Here, we present a practical solution how the sampling effort could be re-allocated without decreasing the precision and confidence of status class assignment. For demonstrating this, we used a large data set of 272 intensively monitored Finnish lake, coastal, and river waterbodies utilizing an existing framework for quantifying…
Conditional particle filters with diffuse initial distributions
2020
Conditional particle filters (CPFs) are powerful smoothing algorithms for general nonlinear/non-Gaussian hidden Markov models. However, CPFs can be inefficient or difficult to apply with diffuse initial distributions, which are common in statistical applications. We propose a simple but generally applicable auxiliary variable method, which can be used together with the CPF in order to perform efficient inference with diffuse initial distributions. The method only requires simulatable Markov transitions that are reversible with respect to the initial distribution, which can be improper. We focus in particular on random-walk type transitions which are reversible with respect to a uniform init…
Yliopistotutkintojen määrän ennustaminen Bayes-mallilla
2017
Tämän tutkielman tarkoituksena on kehittää prediktiivinen malli, jolla ennustetaan Jyväskylän yliopiston matemaattis-luonnontieteellisessä tiedekunnassa lähivuosina suoritettavien luonnontieteiden kandidaatin ja filosofian maisterin tutkintojen lukumääriä. Mallin estimointiin käytettävä aineisto koostuu kolmesta osasta: vuosina 1996–2004 tiedekunnassa aloittaneet opiskelijat, vuosina 2005–2015 tiedekunnassa alemmasta korkeakoulututkinnosta aloittaneet opiskelijat ja vuosina 2005–2016 tiedekunnassa ylemmästä korkeakoulututkinnosta aloittaneet opiskelijat. Jokaiselle aineiston osalle sovitetaan omat toisistaan riippumattomat osamallit. Tutkintoennusteet saadaan ennustamalla aineistoon kuuluvi…
On the usage of joint diagonalization in multivariate statistics
2022
Scatter matrices generalize the covariance matrix and are useful in many multivariate data analysis methods, including well-known principal component analysis (PCA), which is based on the diagonalization of the covariance matrix. The simultaneous diagonalization of two or more scatter matrices goes beyond PCA and is used more and more often. In this paper, we offer an overview of many methods that are based on a joint diagonalization. These methods range from the unsupervised context with invariant coordinate selection and blind source separation, which includes independent component analysis, to the supervised context with discriminant analysis and sliced inverse regression. They also enco…
Data from an international multi-centre Study of Statistics and Mathematics Anxieties and Related Variables in University Students (the SMARVUS Datas…
2023
This large, international dataset contains survey responses from N = 12,570 students from 100 universities in 35 countries, collected in 21 languages. We measured anxieties (statistics, mathematics, test, trait, social interaction, performance, creativity, intolerance of uncertainty, and fear of negative evaluation), self-efficacy, persistence, and the cognitive reflection test, and collected demographics, previous mathematics grades, self-reported and official statistics grades, and statistics module details. Data reuse potential is broad, including testing links between anxieties and statistics/mathematics education factors, and examining instruments’ psychometric properties across differ…
Itseopiskelumateriaalia: Kausaalimallintamisen perusteet tilastotieteessä
2016
Tämä moniste on tarkoitettu itseopiskelumateriaaliksi tilastotieteen maisterivaiheen opiskelijoille (tai vastaavat tiedot omaaville). Erityisesti todennäköisyyslaskennan ja yleistettyjen lineaaristen mallien tuntemus on tarpeen. Materiaalin tarkoituksena on selvittää lukijalle perusteet Judea Pearlin kehittämästä kausaalimallintamisesta ja -laskennasta. Materiaali perustuu Judea Pearlin kirjaan Causality [Pearl, 2009]. Lauseiden ja määritelmien kohdalla annetaan aina kirjan osio, josta nämä löytyvät. nonPeerReviewed
Sattumaa, haperotatteja ja keltainen syklotroni : aikalaistarinoita Jyväskylän yliopiston matemaattis-luonnontieteellisen tiedekunnan 50-vuotiselta t…
2015
Analysis and evaluation of cell imputation
2008
Bayesian semiparametric long memory models for discretized event data
2020
We introduce a new class of semiparametric latent variable models for long memory discretized event data. The proposed methodology is motivated by a study of bird vocalizations in the Amazon rain forest; the timings of vocalizations exhibit self-similarity and long range dependence. This rules out Poisson process based models where the rate function itself is not long range dependent. The proposed class of FRActional Probit (FRAP) models is based on thresholding, a latent process. This latent process is modeled by a smooth Gaussian process and a fractional Brownian motion by assuming an additive structure. We develop a Bayesian approach to inference using Markov chain Monte Carlo and show g…