El alumno Iñigo Elguea Aguinaco obtuvo la calificación SOBRESALIENTE CUM LAUDE con mención Doctorado Industrial
El alumno Iñigo Elguea Aguinaco obtuvo la calificación SOBRESALIENTE CUM LAUDE con mención Doctorado Industrial
El alumno Iñigo Elguea Aguinaco obtuvo la calificación SOBRESALIENTE CUM LAUDE con mención Doctorado Industrial
- Título de tesis: Reinforcement learning approaches for collaborative robot control in manipulation tasks
Tribunal:
- Presidencia: Dimitrios Chrysostomou (Aalborg University)
- Vocalía: Gorka Sorrosal Yarritu (Ikerlan)
- Vocalía: Iñaki Vázquez Gómez (Universidad de Deusto)
- Vocalía: Aljaz Kramberger (University of Southern Denmark)
- Secretaría: Ganix Lasa Erle (Mondragon Unibertsitatea)
Resumen:
Con el crecimiento exponencial de los avances tecnológicos y la creciente dependencia en los equipos eléctricos y electrónicos, el tratamiento eficiente de los productos al final de su vida útil se ha vuelto esencial para mitigar el impacto ambiental. La remanufactura presenta un enfoque ambiental y económicamente ventajoso para abordar estos impactos. Sin embargo, aunque la automatización ha tenido éxito en la fabricación, en la remanufactura se sigue prefiriendo el trabajo manual, sobre todo en el desensamblaje, debido a las incertidumbres operativas. En este sentido, el aprendizaje por refuerzo ofrece una alternativa para la toma de decisiones y el control en sistemas dinámicos, aunque la eficacia y la capacidad de generalización del aprendizaje de tareas de desensamblaje siguen sin estar claras.
Esta tesis doctoral industrial investiga la aplicación de técnicas de aprendizaje por refuerzo en el contexto específico del desmontaje de juntas magnéticas de puertas de frigoríficos en un entorno de trabajo humano-robot, centrándose en tres pilares básicos del aprendizaje por refuerzo en la actualidad: el rendimiento, la eficiencia en el muestreo y generalización. Partiendo de estas áreas de investigación, la tesis propone inicialmente una prueba de concepto que combina la seguridad y la eficiencia del flujo de trabajo en un entorno aleatorio de desensamblaje humano-robot. Posteriormente, el estudio se amplía con el aprendizaje de la política de control a través de un marco de aprendizaje por refuerzo interactivo en el que el rol del ser humano se sustituye por un supervisor automatizado que utiliza técnicas de modelado basadas en restricciones para mejorar la eficiencia de muestro. Los resultados de ambos estudios se presentan tanto en simulación y como en realidad.