Matière
Fondements statistiques pour la science des données
Description
Cet enseignement présente les principes fondamentaux de probabilité et de statistique nécessaires pour appréhender l’analyse de données.
Compétences requises
Cet enseignement reprend les notions à la base, et il n’y a donc pas de pré-requis stricts, en-dehors des notions mathématiques de bases (notion de probabilité, d’intégrale, de dérivée). Il est cependant préférable que l’étudiant connaisse les notions de bases de probabilité et de statistiques, qui sont parcourues assez rapidement.
Compétences visées
À l'issue de cette UE un étudiant saura :
- Manipuler les bases de probabilités et décrire une variable aléatoire,
- Décrire un échantillon et estimer des paramètres, en incluant un intervalle de confiance,
- Utiliser des tests statistiques,
- Estimer et interpréter une régression linaire gaussienne ou logistique,
- Réaliser et interpréter une réduction de dimension par ACP.
- Utiliser le logiciel libre R
Discipline(s)
- Informatique
Syllabus
- Probabilités, indépendance, probabilité conditionnelle, formule de Bayes ; loi de de variables aléatoires continues et discrètes, espérance, variance, quantiles ; loi des grands nombres et théorème central limite.
- Statistiques descriptives, modélisation et estimation de paramètres ; intervalles de confiance
- Tests statistiques : principe et vocabulaire, tests de bases
- Modèles linéaires gaussiens et généralisés, interprétation en termes statistiques et comme outil d’apprentissage supervisé, sélection de variables
- Réduction de dimension par ACP, ACM, ACF.
Informations complémentaires
Des notes de cours et des exercices (y compris leur correction) seront disponibles sur Moodle.
Bibliographie
- Introduction à la statistique avec R, Frédéric Bertrand et Myriam Maumy-Bertrand, Dunod, 2014.