EC
Commande optimale et apprentissage
Compétences requises
Mathématiques pour l’ingénieur ; commande et observation des systèmes dynamiques, en particulier commande par retour d’état ; Matlab.
--
Mathematics for engineers, control and observation of dynamic systems, state feedback control ; Matlab.
Compétences visées
L'objectif de ce cours est d'introduire la commande optimale et sa relation avec l'apprentissage par renforcement. Il vise à couvrir, plus largement qu'en profondeur, les fondamentaux du sujet, et la compréhension des outils théoriques et pratiques qui permettent de résoudre de tels problèmes.
À l'issue de ce cours, l'étudiant sera capable de réaliser la synthèse et l'implémentation de lois de commande optimales.
--
The objective of this course is to introduce Optimal Control and its relationship with Reinforcement Learning. It aims for covering, more broadly than deeply, the fundamentals of the subject, and the understanding of the theoretical and practical tools that permit to solve such problems.
After this course, the student will be able to achieve the synthesis and implementation of optimal control laws.
Syllabus
Optimisation - un rappel
Calcul des variations
Le principe de Pontryagin
La programmation dynamique et l’équation de Hamilton–Jacobi–Bellman
Les Régulateur Linéaire Quadratique
La commande prédictive
Une introduction à l'apprentissage par renforcement
--
Optimization - a reminder
Calculus of variations
Pontryagin principle
Dynamic Programming and the Hamilton–Jacobi–Bellman equation
Linear Quadratic Regulator
Model Predictive Control
Introduction to Reinforcement Learning
MCC
Les épreuves indiquées respectent et appliquent le règlement de votre formation, disponible dans l'onglet Documents de la description de la formation
- Régime d'évaluation
- ECI (Évaluation continue intégrale)
Évaluation initiale / Session principale - Épreuves
| Libellé | Type d'évaluation | Nature de l'épreuve | Durée (en minutes) | Coefficient de l'épreuve | Note éliminatoire de l'épreuve | Note reportée en session 2 |
|---|---|---|---|---|---|---|
Contrôle | 1 SC | ET | 120 | 0.70 | ||
Travaux pratiques | 3 SC | R | 0.30 |
Seconde chance / Session de rattrapage - Épreuves
| Libellé | Type d'évaluation | Nature de l'épreuve | Durée (en minutes) | Coefficient de l'épreuve | Note éliminatoire de l'épreuve |
|---|---|---|---|---|---|
Contrôle | 1 AC | ET | 60 | 1 |