6533b7d8fe1ef96bd1269cb2

RESEARCH PRODUCT

Tilastollisia luokittelumenetelmiä koneelliseen tunnistamiseen : sovellus pohjaeläinaineistoon

Johanna ÄRje

subject

pohjaeläimistöBayes luokittelijabayesilainen menetelmätunnistaminenluokitus

description

Pohjaeläimiä käytetään biologisessa seurannassa, jolla tutkitaan ihmistoiminnan vaikutuksia vesistöjen ympäristön tilaan. Perinteisesti pohjaeläimet tunnistetaan manuaalisesti. Tässä työssä tarkastellaan, miten pohjaeläimiä tunnistetaan koneellisesti käyttäen luokittelumenetelmiä, jotka ovat tuottaneet hyviä tuloksia planktoneilla. Pohjaeläinten tapauksessa on tärkeää saavuttaa mahdollisimman tarkat estimaatit lajien suhteellisille osuuksille. Tätä varten tarkastellaan sekaannusmatriisikorjauksena tunnettua menetelmää lajiosuuksien estimaateille. Pohjaeläimet ovat vesistöjen pohjassa eläviä selkärangattomia eläimiä, jotka reagoivat nopeasti ympäristön muutoksiin. Niiden runsaussuhteiden muutokset kertovat ympäristön tilan muutoksista. Biologinen seuranta on biologisten laatutekijöiden, kuten pohjaeläinten, havainnointia. Biologisessa seurannassa pohjaeläinten havaituista lukumääristä lasketaan useita indeksejä, joita käytetään vesistöjen vertailussa. Koneellisessa tunnistamisessa tutkittavat kohteet kuvataan tietokoneelle, ja kuvasta segmentoidaan, eli erotellaan, jokainen hahmo muista yksilöistä ja taustasta. Yksilökuvista määritetään yksilön ominaisuuksia kuvaavia piirteitä, joiden avulla hahmot luokitellaan. Tässä työssä keskitytään luokittelumenetelmiin. Aineistoon sovellettavat luokittelumenetelmät ovat Bayes-luokittelija, päätöspuu ja satunnainen metsä. Lisäksi tarkastellaan vähemmän käytettyä satunnaisen metsän sovellusta Bayes-luokittelijaan. Tämän odotetaan parantavan perinteisen Bayes-luokittelijan robustisuutta ja tarkkuutta. Luokkakohtaiset luokitteluvirheet aiheuttavat harhaa luokittelun tuloksena saataviin lajiosuuksien estimaatteihin. Tämän vuoksi työssä sovelletaan sekaannusmatriisikorjauksena tunnettua menetelmää näiden estimaattien korjaamiseksi. Tutkielmassa kaikilla luokittelumenetelmillä saavutetaan erittäin hyviä tuloksia. Bayes-luokittelijan luokitteluvirhe on pienin ja sillä saavutettuja tuloksia esitellään myös käsikirjoituksessa [10]. Erityisesti lajiosuuksien korjaus tuottaa kiinnostavia tuloksia. Bayes-luokittelija toimii jo itsessään hyvin, mutta kaikilla muilla luokittelijoilla sekaannusmatriisikorjauksella saadaan luokittelun tuloksia paremmat estimaatit lajien suhteellisille osuuksille. Etenkin satunnaisen Bayes-metsän korjatuilla estimaateilla saavutetaan kilpailukykyisiä tuloksia Bayes-luokittelijan luokittelun tuloksena saatujen lajiosuuksien estimaattien kanssa.

http://urn.fi/URN:NBN:fi:jyu-201006102027