Introduction à la science des données pour l'IA
- Duration: 8 weeks
- Effort: 32 hours
- Pace: ~4 hours/week

Description
Le cours Science des données pour l’Intelligence Artificielle présente les concepts essentiels permettant de collecter les données de différentes sources, de les stocker, d’effectuer des prétraitements sur ces données, de les visualiser, de les analyser, et de développer des modèles de prédiction.
Ce cours s'adresse principalement aux professionnels qui ont de l’intérêt pour les sciences de données et l’Intelligence Artificielle, aux diplômés et étudiants des programmes techniques des collèges ayant des connaissances de base en mathématiques et en programmation. Ce cours sera aussi d’une grande utilité pour quiconque est intéressé à s’initier à l’Intelligence Artificielle et la science des données.
Par son contenu pratique, ce cours vous permettra d’avoir une première expérience en science des données et Intelligence Artificielle, plus spécifiquement en apprentissage automatique. À la fin de ce cours vous serez en mesure de développer des scripts en python, d’appliquer des techniques de collecte de données, de comprendre et d’expliquer les concepts essentiels de la science des données pour l’Intelligence Artificielle, de pratiquer les techniques de base utilisées dans le processus de développement d’un modèle de prédiction et d’appliquer des algorithmes d’apprentissage supervisé et non-supervisé.
Nous estimons qu’il faut environ 8 semaines pour suivre ce cours. Celui-ci est divisé en sections pertinentes que vous pourrez suivre à votre propre rythme. Des quiz récapitulatifs sont prévus à la fin de chaque section pour vous permettre d’évaluer votre compréhension du contenu. Vous pourrez également réaliser des exercices pratiques qui vous permettront de vous familiariser avec les techniques principales de la science des données utilisées dans l’Intelligence Artificielle. Des solutionnaires des exercices pratiques sont aussi disponibles pour vous permettre de valider vos réponses.
Ce cours vous est offert par le Collège de Bois-de-Boulogne, en collaboration avec l’Université de Montréal. Le contenu a été développé par des experts du domaine de la science des données et de l’Intelligence Artificielle de la Formation continue du Collège de Bois-de-Boulogne.
Le collège de Bois-de-Boulogne (et sa Formation continue) rayonne depuis de nombreuses années par la qualité de son enseignement, la diversité de son offre et la carte de ses programmes de formation reconnus par les employeurs, ce qui en fait un des meilleurs collèges francophones au Québec. Que vous choisissiez ce cours à titre personnel ou dans une perspective de carrière en science, le point de départ est ici. La matière parcourue vous permettra de vous préparer avant de commencer un programme d’études en science des données, Intelligence Artificielle ou tout autre étude liée à la donnée.
Nous vous souhaitons la bienvenue dans ce cours d’initiation à la science des données pour l’Intelligence Artificielle.
Ce cours sera suivi de quatre ateliers pratiques en mode à distance synchrone d’une durée de 21 heures chacun (le nombre de places est limité !)
Voici les liens d’inscription :
- Atelier 1 : Introduction à la gestion de données pour l’IA
- Atelier 2 : Collecte et stockage des données
- Atelier 3 : Transformation, manipulation et prétraitement des données massives
- Atelier 4 : Analyse exploratoire et prédiction
Ce que vous allez apprendre :
À la fin de ce cours, vous serez en mesure de :
- Développer des scripts en langage Python
- Décrire les concepts essentiels de la science des données
- Appliquer des techniques de collecte de données
- Appliquer les méthodes mathématiques et statistiques utilisées en science des données
- Pratiquer les techniques de base utilisées dans le processus de développement d’un modèle de prédiction
- Appliquer des algorithmes d’apprentissage supervisé et non-supervisé
Prérequis :
Ce cours est accessible à tous et ne nécessite pas de prérequis.
Des connaissances dans les domaines suivants seraient des atouts pour faciliter l’apprentissage :
- Mathématique
- Statistiques
- Éléments de base en programmation
Syllabus :
Recommandation de parcours des modules :
Pour ceux qui voudraient s’initier à la science des données, nous vous conseillons le parcours suivant : introduction à la gestion des données pour l’IA suivi, dans l’ordre, des modules 1, 2, 4, 3 et 5.
Pour ceux qui ont déjà de bonnes bases en programmation python, le parcours suggéré est introduction à la gestion des données pour l’IA, ensuite les modules, dans l’ordre, 2, 4, 3 et 5.
Par contre, ceux qui ont déjà fait un cours d’introduction à l’apprentissage automatique ou l’intelligence artificielle, il est suggéré de suivre les modules dans l’ordre 2, 4, 3 et 5.
Introduction à la gestion des données pour l’IA
- Les sources de données
- Notion de données
- Types d'apprentissage automatique
- Processus de développement de modèles
- Étude de cas: la voiture autonome
- Évaluation : Module d’introduction
Module 1 – Environnement de développement : outils et langage de programmation (Python)
- Syntaxe de base Python
- Structures de test
- Structures de boucle
- Fonctions
- Classes et Objets
- Héritage
- Évaluation : Module 1
Module 2 – Collecte et stockage des données
- Introduction à la collecte de données dans le contexte de l'IA
- Types de données
- Collecte de données fichiers
- Collecte à partir de bases de données relationnelles
- Collecte à partir de bases de données NoSQL
- Collecte à partir de fichiers JSON
- Moissonnage du web « Web scraping »
- Évaluation : Module 2
Module 3 – Transformation, manipulation et prétraitement des données massives
- Anonymisation des données
- Transformation des données
- Techniques de remplacement « imputing »
- Concept d’encodage catégoriel
- Extraction et sélection de caractéristiques « Feature engineering »
- Manipulation de structure de données
- Évaluation : Module 3
Module 4 – Analyse exploratoire, visualisation des données et prédiction
- Introduction à l’analyse exploratoire de données
- Analyse univariée non-graphique
- Analyse univariée graphique
- Analyse multivariée non-graphique
- Analyse multivariée graphique
- Analyse prédictive
- Évaluation : Module 4
Module 5 – Science des données, sélection des modèles, partitionnement et réduction, prédiction
- Modules python pour la science de données
- Apprentissage supervisé
- La régression linéaire
- Introduction à la classification
- Distances et mesures
- Construction d'un modèle
- Apprentissage non supervisé
- Algorithme « K-means »
- Analyse de composantes principales
- Principe de la régularisation
- Chaine CI/CD
- Déploiement de modèles
- Évaluation : Module 5
Course runs
Archived
- PIA-IGSDFR, from March 9, 2022 to March 8, 2023
Course team
Chaffar, Soumaya
Ph.D.
Enseignante informatique / Chercheure en Intelligence Artificielle
Collège de Bois-de-Boulogne
Bensmaia, Mustapha Kamel
M.Sc.
Étudiant dans le programme d’Intelligence Artificielle
Collège de Bois-de-Boulogne
![]() | ![]() |