Advanced Reinforcement Learning Algorithms for Multi-Armed Bandit Problems Doctorando/a: Francisco Robledo Relaño Año: 2024 Universidad: UPV/EHU Personas encargadas de la dirección: Urtzi Ayesta Morate y Florin Avram