% INF889G — Vision par ordinateur % UQAM — Département d'informatique % Plan de cours — Hiver 2023 * Horaires, locaux et enseignants: Enseignement ============ Lefebvre, Joël PK-4840 Groupes: 040 Les étudiant.e.s doivent consulter régulièrement le site Moodle du cours, moyen officiel de communication entre le professeur et le groupe-cours. Les annonces et mises à jour seront publiées sur le forum de nouvelles du site Moodle. - Un forum de discussion en ligne est l'outil pour interagir avec le professeur, démonstrateurs et les autres étudiants. - Pour les questions d'ordre général, utilisez le forum et attendez quelques jours avant de relancer. - Pour des questions plus spécifiques, personnelles ou pour relancer, contactez le professeur par courriel en ajoutant le libellé \[INF889G\] dans le sujet de votre courriel. - Aucune remise de TP par courriel n'est acceptée. Le site web officiel du cours est sur Moodle, il contient le matériel du cours (diapositives, vidéos, etc.) et servira pour les évaluations en ligne (ex. remise des devoirs). Description du cours ==================== Ce cours vise à familiariser les étudiants avec les notions théoriques et pratiques en vision par ordinateur (aussi nommé vision artificielle, vision numérique ou vision machine). Cette discipline concerne la conception de systèmes et les techniques informatiques permettant de manipuler des images et vidéos, d'extraire l'information contenue afin de permettre à l'ordinateur de comprendre l'information visuelle. **Note** : Le cours INF889G est accepté comme un des deux cours à choisir pour la concentration en intelligence artificielle et pour la concentration en systèmes électroniques. Objectifs du cours ------------------ À l'issue de ce cours, les étudiant.e.s devraient : - Connaître les fondements théoriques et pratiques de la vision par ordinateur - Savoir implémenter des méthodes et algorithmes liés la vision par ordinateur - Réaliser un projet simple en vision par ordinateur Sommaire du contenu ------------------- Formation d'images numériques, modélisation de la couleur. Fondements du traitement d'images, filtres linéaires, extraction de caractéristiques et représentation des textures. Géométrie binoculaire et perception de la profondeur (stéréopsie). Inférence de la structure à partir du mouvement, segmentation, méthodes de suivi, recalage, classification, et détection. Autres sujets (selon le temps disponible) : analyse de données de distance, modélisation et synthèse basée sur les images, estimation de pose, recherche et récupération d'images, apprentissage automatique pour la vision ... Formule pédagogique =================== - Le cours sera donné en présentiel pour la session d'hiver 2023. - Le matériel pédagogique (présentations, énoncés des devoirs, etc.) sera partagé sur le site Moodle du cours. Modalités d'évaluation ====================== - 3 devoirs (15% chacun) - 1 examen intra (25%) - 1 examen final (30%) **Note** : Voir le calendrier sur Moodle pour les dates précises. Outil d'évaluation Pondération Échéance -------------------- ------------- ------------ Devoir 1 15% Semaine 4 Devoir 2 15% Semaine 7 Examen intra 25% Semaine 9 Devoir 3 15% Semaine 13 Examen final 30% Semaine 15 La note finale (en lettre, A+, A, etc.) pour le trimestre sera attribuée en fonction de l'atteinte des objectifs spécifiques à travers les évaluations. La distribution des résultats dans le groupe pourrait aussi être utilisée. Aucune autre opportunité (travail supplémentaire, etc.) d'augmenter le nombre de points ne sera accordée. Règles concernant le seuil de passage ------------------------------------- L'étudiant.e doit obtenir - Une note cumulative et pondérée aux examens supérieure ou égale à 50% - **ET** une moyenne générale pondérée (devoirs et examen) supérieure ou égale à 60% Si ces seuils ne sont pas atteints, la mention échec sera automatiquement attribuée au cours. Modalité d'examen ----------------- - Les examens se dérouleront en classe pour une durée de 3h. - Les fautes de français ne seront pas corrigées dans les examens, mais vos phrases doivent être compréhensibles. - **Aucune consultation entre étudiant.e.s n'est permise.** Modalité des travaux pratiques ------------------------------ - Les remises des TP se font électroniquement sur Moodle (les détails techniques seront donnés en classe). - Plusieurs remises peuvent être faites, seule la plus récente sera considérée. - **Retards** : 10% de la note sera retranché par jour de retard. Après 5 jours de retard, aucune remise ne sera acceptée. - **Qualité du français** : La note des travaux pratiques sera réduite de 1% par faute, pour un maximum de 10 % par travail. Matériel et logiciels utilisés ------------------------------ Les étudiant.e.s devront donc disposer d'un ordinateur personnel sur lequel seront effectués les démonstrations, les devoirs, et les autres tâches de programmation. Le langage de programmation Python sera utilisé pour ce cours. Une distribution Python fournie par Anaconda comprenant les modules et dépendances nécessaires au cours et un environnement de développement (Spyder) devra être installée sur l'ordinateur des étudiant.e.s. Ananconda est disponible pour les principaux systèmes d'exploitation (Windows, Mac, Linux). Les laboratoires et travaux pratiques seront réalisés avec Jupyter notebook. Médiagraphie ============ Obligatoires ------------ - Notes de cours sur le site Moodle Références recommandées ----------------------- - Szeliski, R. (2021). *Computer Vision: Algorithms and Applications*. 2e édition London: Springer. ([DOI](https://doi.org/10.1007/978-1-84882-935-0), [Biblio](https://uqam-bib.on.worldcat.org/oclc/696299718), version gratuite accessible sur le [site web de l'auteur](http://szeliski.org/Book/)) - Distante, A., & Distante, C. (2020). *Handbook of image processing and computer vision. Volume 1: from energy to image*. Springer. [Biblio](https://uqam-bib.on.worldcat.org/oclc/1157084891). - Distante, A., & Distante, C. (2020). *Handbook of image processing and computer vision. Volume 2: from image to pattern*. Springer. [Biblio](https://uqam-bib.on.worldcat.org/oclc/1157085109). - Distante, A., & Distante, C. (2020). *Handbook of image processing and computer vision. Volume 3: from pattern to object*. Springer. [Biblio](https://uqam-bib.on.worldcat.org/oclc/1158230002). - Forsyth, D. A., & Ponce, J. (2012). *Computer Vision: A Modern Approach*. (2 ed.) Pearson. - Hartley, R., & Zisserman, A. (2004). *Multiple view geometry in computer vision* (Ser. Cambridge books online). Cambridge University Press. ([Biblio](https://uqam-bib.on.worldcat.org/oclc/776970484)). - Gonzalez, R. C., & Woods, R. E. (2018). *Digital image processing* (Fourth edition. Global). Pearson. ([Biblio](https://uqam-bib.on.worldcat.org/oclc/1019671882)) - Burger, W., & Burge, M. J. (2009). *Principles of digital image processing : fundamental techniques* (Ser. Undergraduate topics in computer science). Springer. ([Biblio](https://uqam-bib.on.worldcat.org/oclc/1136519670)). - Burger, W., & Burge, M. (2009). *Principles of digital image processing : core algorithms* (Ser. Undergraduate topics in computer science). Springer. ([Biblio](https://uqam-bib.on.worldcat.org/oclc/656394834)). - Burger, W., & Burge, M. (2013). *Principles of digital image processing : advanced methods* (Ser. Undergraduate topics in computer science). Springer. ([Biblio](https://uqam-bib.on.worldcat.org/oclc/843189235)) Des références complémentaires seront partagées sur le site Moodle du cours.