% INF5081 — Gestion et analyse de données % UQAM — Département d'informatique % Plan de cours — Été 2023 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Coordination ------------ Bouguessa, Mohamed PK-4915 Enseignement ------------- , Groupes: 020 Description du cours ==================== Objectifs --------- Développer une capacité d'analyse des besoins en gestion de données en fonction du contexte d'application. Être en mesure de justifier l'usage et de mettre en oeuvre une méthode avancées de gestion des données. Sommaire du contenu ------------------- Présentation et comparaison des différentes méthodes de gestion et d'analyse de données. Les entrepôts de données. Extraction de connaissances et forage de données. Prétraitement et préparation des données, apprentissage automatique et algorithmes d'exploitation de données prédictives (apprentissage supervisé) et descriptives (apprentissage non supervisé), données transactionnelles et recherche de règles d'associations. Préalables académiques ---------------------- - INF3080 - Bases de données - INF3105 - Structures de données et algorithmes Cours en présentiel =================== **Enseignement en présentiel.** Les étudiant.e.s doivent consulter régulièrement le site Moodle du cours, moyen de communication du professeur avec le groupe-cours. Les annonces officielles seront publiées sur Moodle. Le site web officiel du cours est sur Moodle, il contient le matériel du cours(diapositives, énoncés des travaux, etc.) et servira pour la remise des travaux et examens. Contenu du cours ================ **Partie 1 : Apprentissage automatique (Forage de donnée prédictif)** - Le forage de données et l'extraction des connaissances. - Algorithmes de forage de données prédictive: apprentissage supervisé: - Arbre de décision. - Forets d'arbres décisionnelles. - Classification bayésienne. - Évaluation des algorithmes d'apprentissage supervisé. - Réseaux de neurones. - Introduction à l'apprentissage profond. - Réseaux de neurones à convolution **Partie 2 : Apprentissage non supervisé(Forage de donnée descriptive)** - L'analyse descriptive et le forage de données. - Données transactionnelles et recherche d'associations: Algorithme APRIORI. - Algorithmes de classification automatique non supervisé(clustering): - K-means Clustering (algorithmeK-means). - Clustering hiérarchique (approche agglomératives: lien unique, lien complet et lien moyen). - Clustering basé sur la densité. - Segmentation des graphes. **Partie 3 : Entrepôts de données** - Les architectures d'entrepôts de données. - Modélisation multidimensionnelle et OLAP. - Extension SQL pour OLAP. Modalités d'évaluation ====================== Description sommaire Semaine Pondération (%) ------------------------ --------- ----------------- Examen mi-session 8 25 Examen final 15 25 Deux travaux pratiques 50 (25 + 25) En cas de divergences avec l'entente d'évaluation, les modalités de l'entente d'évaluation prévalent. Remarques ========= - Les travaux pratiques peuvent être réalisés seul ou en équipe de deux personnes aux maximum. - L'étudiant-e doit obtenir une moyenne cumulée supérieure ou égale à 50% aux examens, ainsi qu'une moyenne générale pondérée (TPs et examens) supérieure ou égale à 50% ; dans le cas contraire, il se verra attribuer un échec. - L'étudiant-e ne remettant aucun des travaux se verra attribuer un échec. - En cas de retard dans la remise des travaux, une pénalité de 10% (de la note du travail) par jour ouvrable sera appliquée. Un retard de plus d'une semaine (7 jours incluant les fins de semaines) ne sera pas accepté. Médiagraphie ============ \[1\] Aurelien Geron. Machine Learning avec Scikit-Learn : Mise en œuvreet cas concrets. Dunod, 2019. \[2\] J. Krohn, G. Beyleveld, A. Bassens. Deep Learning Illustrated:AVisual, Interactive Guide to Artificial Intelligence. Pearson's Addison-Wesley, 2019. \[3\] A. Cornuéjols, L. Miclet, Y. Kodratov. Apprentissage artificiel: Concepts et algorithmes (3è édition), Eyrolles, 2018. \[4\] P-N Tan, M. Steinbach, V. Kumar. Introduction to Data Mining, Addison Wesley, 2006. (Site web du livre : http://www-users.cs.umn.edu/\~kumar/dmbook/index.php) \[5\] Tom M. Mitchell. Machine Learning, McGraw Hill, 1997. (Site Web du livre : http://www.cs.cmu.edu/\~tom/mlbook.html)