Abstraction y Guia para Escalar Aprendizaje por Refuerzo

Abstraction y Guia para Escalar Aprendizaje por Refuerzo

Dr. Eduardo Morales Manzanares

Texto completo de la Conferencia   

 Resumen

Aprendizaje por refuerzo es una de las técnicas de aprendizaje que ha recibido gran atención en los últimos años. La idea básica es lograr que un agente aprenda una política óptica, esto es, cual es la mejor acción a tomar en cada estado, para lograr la máxima recompensa esperada en el futuro. En principio, esta técnica se puede utilizar para aprender diferentes estrategias de control, sin embargo, los esquemas tradicionales tienen problemas con espacios de estados grandes, no pueden reutilizar las politicas aprendidas en problemas similares y solo realizan acciones discretas. En esta platica daremos una introducción a lo que es aprendizaje por refuerzo, analizaremos algunas de sus limitaciones y presentaremos algunas extensiones que hemos propuesto para atacar los problemas antes planteados. En particular mostraremos como con el esquema propuesto podemos aprender a jugar finales de juego sencillos en ajedrez, podemos aprender a controlar un robot en algunas tareas de navegación y podemos aprender a volar un avion simulado.
  

Esbozo Curricular

Egresado de Ingeníera Fisica de la UAM-Azcapotzalco (1984). Tiene una maestría en Inteligencia Artificial de la Universidad de Edimburgo (1985) y un doctorado en Computación del Turing Institute-Universidad de Strathclyde (1992), en Escocia. Sus lineas de investigación se centran en el aprendizaje computacional y en la Robótica.

Fue investigador visitante del Electric Power Research Institute, en Palo Alto, California (1986), trabajo en el Instituto de Investigaciones Eléctricas (1986-1988 y 2002-2004), en Cuernavaca, Morelos. Fue consultor técnico del proyecto Europeo "The Machine Learning Toolkit" (1989-1990), fue profesor visitante de la Universidad de New South Wales (2002-2003), en Sydney, Australia, y profesor-investigador del Tec de Monterrey - Campus Cuernavaca (1994-2005). Actualmente (desde 1996) es investigador Titular B del Instituto Nacional de Astrofisica, Óptica y Electrónica en Puebla.

Cuenta con alrededor de 100 publicaciones en revistas, capitulos de libros y congresos de prestigio Internacional. Ha dirigido 11 tesis de doctorado, 24 de maestría, y es miembro del Sistema Nacional de Investigadores, Nivel 2.