Bandits manchots : agir et apprendre en même temps
le 6 septembre 2023
13h15Campus de Beaulieu Salle i-56 - bât. 12D
Intervention de Romaric Gaudel, enseignant-chercheur à l'université de Rennes dans l'équipe LACODAM, à l'IRISA, dans le cadre des séminaires du département Informatique.
Les bandits-manchots à bras multiples modélisent un grand nombre d'applications dans lesquelles un agent artificiel choisit une action à chaque pas de temps et reçoit une récompense aléatoire qui dépend de cette action. La distribution de ces récompenses n'est pas connue et l'agent doit l'apprendre uniquement à partir des récompenses qu'il reçoit. Ce cadre couvre, par exemple, le choix des nouvelles à afficher sur une page web, ou la recommandation de vidéos.
Je présenterai dans ce séminaire les problématiques soulevées par les bandits-manchots, les grandes idées pour y répondre, ainsi que des problèmes toujours ouverts.
- Thématique(s)
- Formation, Recherche - Valorisation
- Contact
- Killian Barrere
Mise à jour le 14 septembre 2023