6533b834fe1ef96bd129d9f7

RESEARCH PRODUCT

Análisis de técnicas de “aggregation”/“disaggregation” aplicadas a imágenes satélite para la estimación de parámetros térmicos superficiales a diferentes escalas

Federico Piñuela García

subject

remote sensingmachine learningdisaggregationland surface temperaturedeep learningUNESCO::FÍSICA::TermodinámicaUNESCO::CIENCIAS DE LA TIERRA Y DEL ESPACIO::Geología::Teledetección (geología)UNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial

description

Las aplicaciones que implican la observación de la superficie terrestre desde plataformas satélites a escala inferior a la regional, como por ejemplo, el caso del seguimiento de cultivos, requieren de una mayor disponibilidad de información térmica, en particular de la temperatura de la superficie terrestre (LST), con resoluciones espaciales apropiadas para un alcance local. Por ello, numerosos autores han propuesto y desarrollado métodos para extraer la LST a nivel “subpíxel”, mediante el empleo de productos complementarios de teledetección, con resultados adecuados para su uso en resoluciones superiores. La mayoría de estos métodos se basan en la correlación entre índices de vegetación, como es el caso del Normalized Difference Vegetation Index (NDVI), y la temperatura superficial (Land Surface Temperature o LST), paracoberturas de características concretas. Estos métodos parten de la implementación de modelos estadísticos "tradicionales", como es el caso de la regresión lineal o de la regresión cuadrática. La disponibilidad de otros índices de vegetación o índices relacionados con la disponibilidad de agua, tiene enorme potencial, gracias al aporte ofrecido por posibles nuevos estimadores. Este hecho, unido al desarrollo de métodos avanzados de computación, basados en técnicas de aprendizaje automático (o machine learning), puede llevar a la creación de algoritmos de desagregación más robustos. La presente tesis doctoral estudia el comportamiento y aporte de varios índices espectrales, así como de otras variables complementarias, para el desarrollo de modelos avanzados de estimación de LST, los cuales tienen su origen en el campo de la Inteligencia Artificial. Mediante estos modelos, se pretende llevar la resolución original, en escala regional, de la variable dependiente LST, a escala local. En particular, se pretende obtener la LST a alta resolución del sensor MSI (20 m), a bordo de las plataformas Sentinel 2, partiendo de la resolución moderada de las bandas térmicas del sensor MODIS (1000 m). El objetivo final es mostrar una primera comparativa de los resultados obtenidos al aplicar estas metodologías de desagregación en la obtención de temperaturas superficiales de mayor resolución, a partir de diferentes variables tanto espectrales como de otra naturaleza. Se ha diseñado el proceso como un proceso comparativo entre modelos de desagregación con recorrido en la bibliografía, especialmente destinados al empleo de un índice de vegetación como estimador de la LST; con modelos más complejos basados en técnicas de aprendizaje automático y con capacidad de utilizar un mayor número de variables independientes en la estimación de la variable dependiente (LST). Entrenados y valorados los resultados de los modelos, se puede afirmar que los modelos multivariable más avanzados ofrecen un cierto grado de mejora en las estimaciones de LST, tanto en comparativa con datos “in situ” como comparando con estimaciones LST procedentes de otras plataformas satelitales, en concreto, Landsat 7 ETM+. Por ejemplo, en el caso de la comparativa de datos “in situ”, se ha observado una mejora en el RMSE robusto de la regresión multivariable con regularización Ridge (3.38◦C) frente a los modelos DisTrad (4.20◦C y 3.88◦C), entre otras. En el caso de la comparativa con los datos de LST extraídos de Landsat 7 ETM+, se mantiene esta tendencia: para la fecha del 9 de julio de 2018, los modelos DisTrad presentan RMSE robustos de 4.30◦C y 4.12◦C, frente a 3.31◦C ofrecido por la regresión Ridge. Applications involving observation of the Earth’s surface from satellite platforms on a lower than regional scale, such as crop monitoring, require greater availability of thermal information, in particular land surface temperature (LST), with spatial resolutions appropriate for local reach. Therefore, numerous authors have proposed and developed methods to extract LST at the “subpixel” level, through the use of complementary remote sensing products, with results suitable for use at higher resolutions. Most of these methods are based on the correlation between vegetation indices, as is the case of the Normalized Difference Vegetation Index (NDVI), and the surface temperature (Land Surface Temperature or LST), for coverage of specific characteristics. These methods are based on the implementation of “traditional” statistical models, such as linear regression or quadratic regression. The availability of other vegetation indices or indices related to water availability has enormous potential, thanks to the contribution offered by possible new estimators. This fact, together with the development of advanced computing methods, based on machine learning techniques, can lead to the creation of more robust disaggregation algorithms. This doctoral thesis studies the behavior and contribution of several spectral indices, as well as other complementary variables, for the development of advanced models of LST estimation, which have their origin in the field of Artificial Intelligence. Through these models, it is intended to bring the original resolution, on a regional scale, of the dependent variable LST, to the local scale. In particular, it is intended to obtain the LST at high resolution of the MSI sensor (20 m), on board the Sentinel 2 platforms, starting from the moderate resolution of the thermal bands of the MODIS sensor (1000 m). The final objective is to show a first comparison of the results obtained by applying these disaggregation methodologies in obtaining surface temperatures at higher resolution, from different variables both spectral and of another nature. The process has been designed as a comparative process between disaggregation models with a path in the literature, especially aimed at the use of a vegetation index as an estimator of the LST; with more complex models based on machine learning techniques and with the ability to use a greater number of independent variables in the estimation of the dependent variable (LST). Trained and evaluated the results of the models, it can be said that the most advanced multivariate models offer a certain degree of improvement in LST estimates, both in comparison with “in situ” data and comparing with LST estimates from other satellite platforms, specifically, Landsat 7 ETM+. For example, in the case of the comparison of data “in situ”, an improvement has been observed in the robust RMSE of multivariable regression with Ridge regularization (3.38◦C) compared to the DisTrad models (4.20◦C and 3.88◦C), among others. In the case of the comparison with LST data extracted from Landsat 7 ETM+, this trend continues: as of July 9, 2018, DisTrad models present robust RMSE of 4.30◦C and 4.12◦C, compared to 3.31◦C offered by the Ridge regression.

https://hdl.handle.net/10550/86554