Apprentissage par renforcement

Code Cours
2324-EDN-COMP-FR-5016
Établissement
Langue d'enseignement
Français, Anglais
Ce cours apparaît dans les formation(s) suivante(s)
Master Data et IA - Crédits ECTS:
Responsable(s)
Abir KARAMI
Période

Présentation

Prérequis

Introduction à l’Intelligence artificielle et l’apprentissage automatique

Objectifs

Ce cours fournie les bases théoriques pour comprendre l’apprentissage par renforcement avec des exemples applicatifs.

Présentation

  • Introduction, terminologies et motivation sur des solutions d’apprentissage par renforcement

  • Les agents décisionnels et la prise de décisions : les Processus Décisionnels de Markov, la fonction de valeurs, la programmation dynamique, l’équation de Bellman

  • Concepts autour des méthodes d'apprentissage par renforcement et leurs politiques : model base, model free, on policy, off policy, compromis exploitation exploration, solutions optimales et sous-optimales

  • L'algorithme de Q Learning

  • L'algorithme de Monte-Carlo

  • Le Fleau de la dimension : taille de problème, nombre de visites vs taille tableaux de valeurs, panorama de solutions existantes pour diminuer la complexité (apprentissage guidé par des heuristiques, bénéficier d'une structure sous-jacente ...)

  • Panorama de cadres applicatifs et leurs spécificités

  • Conclusion sur les avantages et inconvénients des solutions d'apprentissage par renforcement

Modalités

Modalités d'enseignement

24H cours

Évaluation

Ressources

Bibliographie

Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.|| [2] Russell, S. J. (2010). Artificial intelligence a modern approach. Pearson Education,