Commande optimale et apprentissage

Composante	Télécom Physique Strasbourg (TPS)
Heures d'enseignement	CM : 19,25 h TP : 4 h
Ouvert aux étudiants d'autres disciplines
Ouvert aux étudiants en échange
Code Apogée	EP013M22

Compétences requises

Mathématiques pour l’ingénieur ; commande et observation des systèmes dynamiques, en particulier commande par retour d’état ; Matlab.

Mathematics for engineers, control and observation of dynamic systems, state feedback control ; Matlab.

Compétences visées

L'objectif de ce cours est d'introduire la commande optimale et sa relation avec l'apprentissage par renforcement. Il vise à couvrir, plus largement qu'en profondeur, les fondamentaux du sujet, et la compréhension des outils théoriques et pratiques qui permettent de résoudre de tels problèmes.
À l'issue de ce cours, l'étudiant sera capable de réaliser la synthèse et l'implémentation de lois de commande optimales.

The objective of this course is to introduce Optimal Control and its relationship with Reinforcement Learning. It aims for covering, more broadly than deeply, the fundamentals of the subject, and the understanding of the theoretical and practical tools that permit to solve such problems.
After this course, the student will be able to achieve the synthesis and implementation of optimal control laws.

Syllabus

Optimisation - un rappel
Calcul des variations
Le principe de Pontryagin
La programmation dynamique et l’équation de Hamilton–Jacobi–Bellman
Les Régulateur Linéaire Quadratique
La commande prédictive
Une introduction à l'apprentissage par renforcement

Optimization - a reminder
Calculus of variations
Pontryagin principle
Dynamic Programming and the Hamilton–Jacobi–Bellman equation
Linear Quadratic Regulator
Model Predictive Control
Introduction to Reinforcement Learning

Contact

Responsable(s) de l'enseignement

Hassan Omran : homran@unistra.fr

Libellé	Type d'évaluation	Nature de l'épreuve	Durée (en minutes)	Coefficient de l'épreuve	Note éliminatoire de l'épreuve	Note reportée en session 2
Contrôle	1 SC	ET	120	0.70
Travaux pratiques	3 SC	R		0.30