Aprendizaje por Refuerzo Transfiriendo Conocimiento



Aprendizaje por Refuerzo Transfiriendo Conocimiento

Dr. Eduardo Morales Manzanares

23 de Marzo de 2015

12:00 hrs.

Auditorio de Ingeniería Eléctrica

Texto completo de la plática           Video del evento          

 

Resumen

Los robots han ido evolucionando en los últimos años, realizan tareas cada vez más complejas, pero también se han vuelto más difícil de modelar. Una forma para conseguir que los robots realicen tareas, es utilizar sistemas de aprendizaje, como aprendizaje por refuerzo, en donde un robot aprende a realizar una tarea al explorar su ambiente. Desafortunadamente, estas técnicas normalmente requieren tiempos muy largos de apredizaje, se utiliza una representación discretizada, y una vez que se aprende cómo realizar una tarea, no se puede utilizar para aprender otra, aunque sea muy parecida. En esta plática vamos a presentar técnicas de transferencia de conocimiento que permiten acelerar el tiempo de convergencia de algoritmos de aprendizaje por refuerzo y que se pueden aplicar en dominios continuos.

 

Breve semblanza biográfica

 


 

 

El Dr. Eduardo Morales Manzanares es egresado de la carrera de Ingeniería Física de la UAM-Azcapotzalco. Tiene una maestría en Inteligencia Artificial de la Universidad de Edimburgo y un doctorado en Computación del Turing Institute - Universidad de Strathclyde, en Escocia. Sus líneas de investigación se centran en el aprendizaje computacional y en la robótica. Fue investigador visitante del Electric Power Research Institute, en Palo Alto, California, trabajó en el Instituto de Investigaciones Eléctricas, en Cuernavaca, Morelos. Fue consultor técnico del proyecto europeo "The Machine Learning Toolkit", fue profesor visitante de la Universidad de New South Wales, en Sidney, Australia, y profesor-investigador del Tec de Monterrey - Campus Cuernavaca.

Actualmente (desde 2006) es investigador Titular C del Instituto Nacional de Astrofísica, Óptica y Electrónica en Puebla, en donde también tiene el puesto de Coordinador de Ciencias Computacionales. Cuenta con más de 100 publicaciones en revistas, capítulos de libros y congresos de prestigio internacional, es miembro del Sistema Nacional de Investigadores Nivel 3 y miembro de la Academia Mexicana de Ciencias.