Advanced Reinforcement Learning Algorithms for Multi-Armed Bandit Problems Doktoregaia: Francisco Robledo Relaño Urtea: 2024 Unibertsitatea: UPV/EHU Zuzendaria(k): Urtzi Ayesta Morate eta Florin Avram