PrérequisProbabilité II S5
Validation
Enseignant
Volume total 24 h CM , 24 h TP

Syllabus

La science des données est l'étude de méthodes et algorithmes visant à extraire de l'information et de la connaissance à partir de données structurées ou non. C'est une discipline qui s'appuie sur des outils mathématiques, de statistiques, d’informatique et de visualisation des données. Elle est en plein développement surtout dans le secteur privé mais aussi dans le monde universitaire (recherche) ainsi que dans le secteur public et s'invite dans des thématiques très variées : santé, économie, marketing, objets connectés ....

Le but de ce cours est d'introduire les concepts de la Data Science et de développer le cas particulier de l'apprentissage supervisé.

Sommaire

Le contrôle des connaissance se fera sous forme de projets par équipe, avec un examen final.

Programme

  • Pré-traitement des données. Analyse statistique univariée et bivariée.
  • Modèles de régression linéaire.
  • Arbre de décision et Forêts aléatoire.