Stochastic Optimal Control and Reinforcement Learning

linma2222  2025-2026  Louvain-la-Neuve

Stochastic Optimal Control and Reinforcement Learning
La version que vous consultez n'est pas définitive. Cette fiche d’activité peut encore faire l'objet de modifications. La version finale sera disponible le 1er juin.
5.00 crédits
30.0 h + 22.5 h
Q1
Langue
d'enseignement
Anglais
Préalables
Ce cours suppose la familiarité avec des notions de systèmes dynamiques (niveau de LEPL1106 : Signaux et systèmes, et LINMA1510 : Automatique linéaire) et d’analyse et d’algèbre (niveau de LEPL1101 : Algèbre, et LEPL1102 : Analyse I). LINMA2470 : Modélisation stochastique est vivement recommandé.
Thèmes abordés
  • Fondements des probabilités, contrôle optimal
  • Systèmes finis et processus de décision de Markov
  • Modèles d’état : LTI, hybrides, et non-linéaires
  • Contrôle optimal face à l’incertitude sur le modèle
  • Apprentissage par renforcement
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

Contribution du cours aux objectifs de programme :
AA1.1, AA1.2, AA1.3, AA2.2
AA5.5
AA6.3

À l’issue du cours, l’étudiant sera capable de :
• Comprendre le concept d’optimisation d’un processus ou système stochastique ;
• Reformuler des problèmes concrets comme des problèmes mathématiques de décision/conception pour des systèmes stochastiques ;
• Utiliser les outils fondamentaux du contrôle optimal et de l’apprentissage par renforcement pour résoudre des problèmes de décision/conception pour des systèmes stochastiques ;
• Appliquer des outils algorithmiques pour la résolution exacte ou approchée de problèmes de contrôle stochastique optimal, et comprendre leurs points forts et limites et leurs domaines d’applicabilité ;
• Appliquer le concept d’exploitation vs exploration et de minimisation du regret ;
• Procurer une solution exacte ou approchée à des problèmes de contrôle stochastique optimal, avec des applications dans divers domaines, tels que les mathématiques financières, la robotique, …

Acquis d'apprentissage transversaux :
• Gérer des problèmes techniques imprévus qui apparaissent lors de l'optimisation d'un système réel ;
• Formuler des hypothèses raisonnables pour un problème donné, et les évaluer a posteriori ;
• Participer à un cours technique en anglais.
 
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en sciences actuarielles

Master [120] en statistique, orientation générale

Master [120] : ingénieur civil en mathématiques appliquées