TP_UE_27619 | Moodle IP Paris

Options d’inscription

TP_UE_27619 2025/2026 - APM_5AI18_TP - Reinforcement learning

This course presents techniques of reinforcement learning (Markov decision processes, TD-learning, Q-learning, bandit algorithms, Monte-Carlo Tree Search) and their application to real use cases (games, content recommendation).

Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.

Mentions légales