Fondamentaux de la science des données
- Duration: 8 weeks
- Effort: 30 hours
- Pace: ~3h45/week
Comment tirer profit des milliards de données générées par les activités humaines sans s’y perdre? Inscrivez-vous au MOOC Science des données pour découvrir les concepts fondamentaux qui sont au cœur de l’intelligence artificielle!

Description
Les données sont omniprésentes dans nos vies modernes, et leur quantité est faramineuse. Elles peuvent nous être très utiles dans tous les domaines de l’activité humaine comme la santé, le commerce et l’environnement, pour n’en nommer que quelques-uns. Mais comment tirer profit de ces données sans s’y perdre? Le cours Science des données présente les concepts essentiels permettant de collecter les données, de les traiter statistiquement, de les vérifier, de les visualiser, de les structurer et de les analyser. Nous allons décrire certains algorithmes d'apprentissage automatique, et leurs applications aux données.
Ce cours s'adresse principalement aux professionnels du secteur et aux universitaires ayant des connaissances de base en mathématiques et en programmation (idéalement Python). Les étudiants diplômés en sciences et en ingénierie (principalement ceux qui ne sont pas encore familiarisés avec la science des données) peuvent trouver ce contenu instructif et convaincant. Le contenu de ce cours sera également d’une grande utilité pour quiconque utilise ou s’intéresse à la science des données, de quelque manière que ce soit.
Nous estimons qu’il faut environ 8 semaines pour suivre ce cours. Celui-ci est divisé en segments pertinents que vous pouvez regarder à votre propre rythme. Des quiz récapitulatifs sont prévus à la fin de chaque segment pour évaluer votre compréhension du contenu. Vous pourrez également mettre la main à la pâte en réalisant des exercices pratiques qui vous permettront de vous familiariser avec les principaux savoir-faire issus de la science des données.
Ce cours a été développé par des experts du domaine du département d’informatique et de recherche opérationnelle (DIRO) de l’université de Montréal.
L’Université de Montréal rayonne depuis de nombreuses années par la qualité de son enseignement et la diversité de son offre, ce qui en fait une des meilleures universités francophones au monde. Que vous choisissiez ce cours à titre personnel ou dans une perspective de carrière en science, le point de départ est ici. La matière parcourue vous permettra de vous préparer avant de commencer un programme d’études en science des données ou toute autre étude liée à ce domaine.
Nous vous souhaitons la bienvenue dans ce cours en sciences des données, une des pierres angulaires de l'intelligence artificielle.
Ce que vous allez apprendre
À la fin de ce cours, vous serez en mesure de :
- D’expliquer les concepts essentiels de la science des données
- D’appliquer les méthodes mathématiques et statistiques utilisées en science des données
Domaine disciplinaire
- Intelligence artificielle
- Science des données
- Apprentissage automatique
- Mathématiques
- Statistiques
- Informatique
Prérequis
Ce cours est accessible à tous et ne nécessite pas de prérequis, mais des connaissances en mathématiques, en statistiques et en programmation seraient un atout pour aller plus loin dans votre étude.
Syllabus
Module 1 – Introduction et vulgarisation
- Introduction
- Survol des principaux thèmes
- Formation pratique 1 : Introduction à la syntaxe en Python
Module 2 – Méthodologie
- Introduction
- Méthodologie
- Formation pratique 2 : Manipulation, analyse et gestion de données
Module 3 – Les données structurées
- Introduction
- Données structurées
- Préparation et nettoyage
- Formation pratique 3 : Visualisation de données
Module 4 – Probabilités et statistiques
- Introduction
- Rappel des probabilités
- Distributions
- Probabilités et statistiques
- Formation pratique 4 : Analyse et traitement d’un jeu de données
Module 5 – Inférence probabiliste
- Introduction
- Probabilités conditionnelles
- Réseaux bayésiens
Module 6 – Prédiction
- Notions d’apprentissage automatique
- Les techniques de prédiction
- Formation pratique 6 : k-NN, sklearn et arbres de décision
Module 7 – Évaluation et sélection de modèles
- Introduction Sur-apprentissage et sous-apprentissage
- Évaluation du modèle
- Méthodes d’ensemble
- Conclusion
- Formation pratique 7 : Régression, biais et variance
Module 8 – Partitionnement des données
- Qu’est-ce que le partitionnement des données?
- Les techniques
- Indices de qualité de partitionnement
- Formation pratique 8 : Partitionnement, K-moyennes, GMM, DBSCAN
Module 9 – Réduction de dimensionnalité
- Qu’est-ce que la réduction de dimensionnalité?
- Les techniques
- Conclusion
- Formation pratique 9 : Réduction de dimensionnalité
Projet intégrateur : Confidentialité différentielle
Course runs
Archived
- DIRO-SD101.1, from Feb. 14, 2022 to Jan. 31, 2023
Course team
Tapp, Alain
PH.D., Directeur scientifique,
Professeur titulaire Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
Université de Montréal
Lokbani, Mohamed Nabil
PH.D, Directeur scientifique
Chef des laboratoires, Chargé de cours, Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
Université de Montréal
Brouillard, Philippe
M.Sc., Étudiant au doctorat et auxiliaire de recherche et d’enseignement, Faculté des arts et des sciences -
DIRO, Université de Montréal
L'Heureux, Arnaud
B.Sc., Étudiant à la maîtrise et auxiliaire de recherche et d’enseignement, Faculté des arts et des sciences -
DIRO, Université de Montréal
Guille-Escuret, Charles
M.Sc., Étudiant au doctorat et auxiliaire de recherche et d’enseignement, Faculté des arts et des sciences -
DIRO, Université de Montréal
Williams, Andrew
B.Sc., Assistant scientifique
Étudiant à la maîtrise et auxiliaire de recherche et d’enseignement,
Faculté des arts et des sciences
DIRO, Université de Montréal
Azer, Farah
PH.D., Étudiant à la maitrise bio-informatique au CHU Sainte-Justine, Centre de recherche des maladies immunitaires et cancers.
Laboratoire du Pr. Vincent Philippe Lavallée. (En cours).
Rui, Ze Ma
B.Sc., Étudiant à la maîtrise en informatique - Option apprentissage automatique
MILA, Université de Montréal
.