6533b82cfe1ef96bd128ec05
RESEARCH PRODUCT
Análisis de métodos de validación cruzada para la obtención robusta de parámetros biofísicos
Jesús DelegidoJ. P. Rivera-caicedoLl. Pérez-planellsJochem Verrelstsubject
TeledeteccióGeography Planning and Developmentlcsh:G1-922Least squaresCross-validationValidación cruzadaProcesos gausianosHold-outAnàlisi de regressióLinear regressionStatisticsPartial least squares regressionEarth and Planetary Sciences (miscellaneous)MLRAbusiness.industryCross-validationRegression analysisPattern recognitionRegresión de Kernel RidgeAprendizaje automáticoRegressionK-foldHold-OutGeographyk-foldPrincipal component regressionArtificial intelligencebusinessKernel Ridge regressionNonlinear regressionGaussian process regressionlcsh:Geography (General)description
[EN] Non-parametric regression methods are powerful statistical methods to retrieve biophysical parameters from remote sensing measurements. However, their performance can be affected by what has been presented during the training phase. To ensure robust retrievals, various cross-validation sub-sampling methods are often used, which allow to evaluate the model with subsets of the field dataset. Here, two types of cross-validation techniques were analyzed in the development of non-parametric regression models: hold-out and k-fold. Selected non-parametric linear regression methods were least squares Linear Regression (LR) and Partial Least Squares Regression (PLSR), and nonlinear methods were Kernel Ridge Regression (KRR) and Gaussian Process Regression (GPR). Cross-validation results showed that LR performed most unstable, while KRR and GPR led to more robust results. This work recommends using a nonlinear regression algorithm (e.g., KRR, GPR) in combination with a k-fold cross-validation technique with k=10 to realize robust retrievals. [ES] Los métodos de regresión no paramétricos son una gran herramienta estadística para obtener parámetros biofísicos a partir de medidas realizadas mediante teledetección. Pero los resultados obtenidos se pueden ver afectados por los datos utilizados en la fase de entrenamiento del modelo. Para asegurarse de que los modelos son robustos, se hace uso de varias técnicas de validación cruzada. Estas técnicas permiten evaluar el modelo con subconjuntos de la base de datos de campo. Aquí, se evalúan dos tipos de validación cruzada en el desarrollo de modelos de regresión no paramétricos: hold-out y k-fold. Los métodos de regresión lineal seleccionados fueron: Linear Regression (LR) y Partial Least Squares Regression (PLSR). Y los métodos no lineales: Kernel Ridge Regression (KRR) y Gaussian Process Regression (GPR). Los resultados de la validación cruzada mostraron que LR ofrece los resultados más inestables, mientras KRR y GPR llevan a resultados más robustos. Este trabajo recomienda utilizar algoritmos de regresión no lineales (como KRR o GPR) combinando con la validación cruzada k-fold con un valor de k igual a 10 para hacer la estimación de una manera robusta Este estudio ha contado con financiación de la Generalitat Valenciana (a través del contrato Gerónimo Forteza de Ll. Pérez, FPA/2015/081) en el marco del proyecto CGL2011-30433-C02-02 financiado por el Ministerio de Economía y Competitividad.
year | journal | country | edition | language |
---|---|---|---|---|
2015-01-01 | Revista de Teledetección |