0000000001091173

AUTHOR

Pablo Escandell Montero

showing 1 related works from this author

Aprendizaje por refuerzo en espacios continuos: algoritmos y aplicación al tratamiento de la anemia renal

2014

El aprendizaje por refuerzo es un paradigma de aprendizaje automático orientado a la resolución de problemas de decisión secuenciales. Este tipo de problemas aparece en aplicaciones pertenecientes a campos tan diversos como control automático, medicina, investigación operativa o economía. Los algoritmos clásicos de aprendizaje por refuerzo están fundamentados en la teoría matemática de la programación dinámica, donde se asume que el espacio de estados es discreto y se compone de un número manejable de estados. Desafortunadamente, en la mayoría de aplicaciones de interés práctico el espacio de estados es continuo, por lo que los algoritmos clásicos dejan de ser útiles. Para poder aplicar el …

:MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial [UNESCO]aprendizaje por refuerzo:MATEMÁTICAS::Estadística::Análisis de datos [UNESCO]programación dinámicaaprendizaje automáticoanálisis de datosUNESCO::MATEMÁTICAS::Estadística::Análisis de datosUNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial
researchProduct