% INF5081 — Gestion et analyse de données % UQAM — Département d'informatique % Plan de cours — Été 2022 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Coordination ------------ Valtchev, Petko PK-4415 Enseignement ------------- Massardi, Jean Groupes: 020 Description du cours ==================== Objectifs --------- Développer une capacité d'analyse des besoins en gestion de données en fonction du contexte d'application. Être en mesure de justifier l'usage et de mettre en oeuvre une méthode avancées de gestion des données. Sommaire du contenu ------------------- Présentation et comparaison des différentes méthodes de modélisation de données : les entrepôts de données et les systèmes de traitement analytique en ligne (OLAP), les bases de données non relationnelles (NoSQL) et traitement des données massives, données transactionnelles et recherche de règles d'associations. Extraction de connaissance et forage de données : techniques d'exploitation de données prédictives et descriptives. Préalables académiques ---------------------- - INF3080 - Bases de données - INF3105 - Structures de données et algorithmes Cours en présentiel =================== **Enseignement en présentiel.** Les étudiant.e.s doivent consulter régulièrement le site Moodle du cours, moyen de communication du professeur avec le groupe-cours. Les annonces officielles seront publiées sur Moodle. Le site web officiel du cours est sur Moodle, il contient le matériel du cours(diapositives, énoncés des travaux, etc.) et servira pour la remise des travaux et examens. Contenu du cours ================ **Partie 1 : Entrepôts de données** - Les architectures d'entrepôts de données. - Modélisation multidimensionnelle et OLAP. - Extension SQL pour OLAP. - Les bases de données non-relationnelles (NoSQL) **Partie 2 : Apprentissage automatique (Forage de donnée prédictif)** - Le forage de données et l'extraction des connaissances. - Algorithmes de forage de données prédictive: apprentissage supervisé: - Arbre de décision et techniques d'élagage de l'arbre. - Forets d'arbres décisionnelles. - Classification bayésienne. - Évaluation des algorithmes d'apprentissage supervisé. - Réseaux de neurones. - Introduction à l'apprentissage profond. - Réseaux de neurones à convolution **Partie 3 : Apprentissage non supervisé(Forage de donnée descriptive)** - L'analyse descriptive et le forage de données. - Algorithmes de classification automatique non supervisé(clustering): - K-means Clustering (algorithmeK-means). - Clustering hiérarchique (approche agglomératives: lien unique, lien complet et lien moyen). - Clustering basé sur la densité. - Segmentation des graphes. - Données transactionnelles et recherche d'associations: Algorithme APRIORI. Modalités d'évaluation ====================== Description sommaire Semaine(s) Pondération (%) ---------------------- ------------ ----------------- Examen mi-session 7 25 Examen final 15 25 TP1 7 à 10 25 TP2 12 à 15 25 En cas de divergences avec l'entente d'évaluation, les modalités de l'entente d'évaluation prévalent. Seuil de passage ---------------- Pour obtenir une note de passage (D ou mieux), l'étudiant doit obtenir: - au moins 50% dans la moyenne cumulée aux examens; et - au moins 50% dans la moyenne cumulée aux travaux pratiques. Si l'un de ces seuils n'est pas atteint, la mention échec (E) sera automatiquement attribuée au cours, et ce, quelles que soient les notes pouvant avoir été obtenues dans l'autre partie. Cela est communément appelé le critère du double seuil de passage. Obtenir 50 % ou plus aux examens et aux travaux pratiques ne garantit pas l'obtention d'une note de passage (D ou mieux). Attribution des notes --------------------- Les seuils des notes littérales (A+, A, ..., D) sont déterminés à la fin. Autres dispositions ------------------- La qualité de présentation est sujette à évaluation. Sans s'y limiter, cela inclut le style de codage, la qualité de présentation de rapport, l'anglais et le français utilisé. Médiagraphie ============ \[1\] Aurelien Geron. Machine Learning avec Scikit-Learn : Mise en œuvreet cas concrets. Dunod, 2019. \[2\] J. Krohn, G. Beyleveld, A. Bassens. Deep Learning Illustrated:AVisual, Interactive Guide to Artificial Intelligence. Pearson's Addison-Wesley, 2019. \[3\] A. Cornuéjols, L. Miclet, Y. Kodratov. Apprentissage artificiel: Concepts et algorithmes (3è édition), Eyrolles, 2018. \[4\] P-N Tan, M. Steinbach, V. Kumar. Introduction to Data Mining, Addison Wesley, 2006. (Site web du livre : http://www-users.cs.umn.edu/\~kumar/dmbook/index.php) \[5\] Tom M. Mitchell. Machine Learning, McGraw Hill, 1997. (Site Web du livre : http://www.cs.cmu.edu/\~tom/mlbook.html)