6533b7d5fe1ef96bd1264422
RESEARCH PRODUCT
Anàlisi discriminant discreta mitjançant suavització de les correspondències múltiples
Jose Vicente Pruñonosa Revertersubject
51Matemáticasnonedescription
El punt de partida del mètode que es presenta en aquest treball és la suposició que les variables discretes procedeixen d'unes subjacents, mixtures de normals, que han estat "tallades" en intervals a cada marginal i permutades posteriorment.D'aquesta manera podem considerar, com és habitual a la literatura, que els factors significatius afecten a la mitjana de les variables subjacents mentre que els no significatius determinen una dispersió gaussiana arreu dels valors centrals de classe. La discretització serà, al seu torn, producte bé de fenòmens d'acumulació-umbralització, típics de molt processos biològics, bé de la imprecisió inherent a l'aparell de mesura. L'esforç es va centrar, com a conseqüència, en retrobar el més acuradament possible la distribució de probabilitat contínua subjacent i posteriorment aplicar una metodologia de discriminació amb variables contínues.Per tal d'aconseguir aquest objectiu "reconstructor" , es van desenvolupar dues fases: A la primera, i mitjançant una anàlisi de correspondències múltiples convenientment adaptada a l'objectiu discriminant, se cercaren quantificacions que aproximessin les mitjanes de les cel·les i a la segona, emprant, un procediment de suavització basat en l'algorisme EM, es va completar la reproducció de la distribució subjacent aplicant una dispersió al voltant d'aquestes mitjanes.Al Capítol 1 s'analitzen les definicions bàsiques de l'anàlisi discriminant i es fa una revisió dels mètodes existents amb l'objectiu esmentat. El segon i el tercer capítol se centren a fer l'equivalent amb l'anàlisi de correspondències i els mètodes de suavització (fonamentalment "kernel" i EM) com a elements bàsics a combinar per tal d'aconseguir l'esmentada reconstrucció. Al Capítol 4 es fa la proposta metodològica i es demostra el resultat que li dóna fonament matemàtic. Finalment, al capítol 5, es discuteixin els resultats amb dades simulades i reals, arribant a les següents conclusions:La prova del mètode amb dades simulades utilitzant un model de normals subjacents amb mitjana diferent per classe i variància comuna pot valorar-se com positiva ja que els seus resultats superen els altres procediments amb què s'ha comparat.Es considera que aquests esperançadors resultats es deuen a la solidesa del resultat matemàtic provat al capítol 4, el qual ens garanteix que la reconstrucció de les dades subjacents contínues es realitza en la direcció correcta.D'altra banda si la suposició d'una multinormal subjacent s'interpreta com el final d'un ampli ventall de processos investigadors quan finalment s'aconsegueix destriar la part rellevant de la que no ho és (en termes de distribució de probabilitat) no resulta sorprenent que un mètode basat en aquestes premisses obtingui bons resultats pràctics, tal i com succeeix als dos exemples reals, de molt diferent procedència, però d'una elevada complexitat, analitzats.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2003-12-04 |