UE
UE Science des données pour l'actuariat 2
Description
Après un rappel des principales méthodes d’analyse factorielle (ACP, AFC, ACM) et des méthodes de classification automatique (CAH et techniques de partitionnement direct), des méthodes d’analyse de données avancées sont présentées :
• Analyse de tableaux multiples (AFM)
• Analyse factorielle discriminante
• Méthodes de segmentation
Ce cours procure les principaux fondements théoriques de chacune des méthodes. L’accent est mis sur les aspects méthodologiques ainsi que sur la mise en œuvre des méthodes dans le logiciel R à partir d’exemples réels.
Programme :
* arbres de décision : régression et classification.
* forêt aléatoire et ensembles de modèles : voting, bootstrap, adaboost
* Deep learning (classification regression). Technique pour éviter le sur-apprentissage: pénalisation lasso-ridge, dimensionnement des couches de neurones, drop-out.
* En guise de synthèse: un projet complet se basant sur des données kaggle