This course presents techniques of reinforcement learning (Markov decision processes, TD-learning, Q-learning, bandit algorithms, Monte-Carlo Tree Search) and their application to real use cases (games, content recommendation).
2025/2026 - APM_5AI18_TP - Reinforcement learning
Options d’inscription
Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.