% BIF7101 — Bioinformatique des structures % UQAM — Département d'informatique % Plan de cours — Hiver 2022 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Coordination ------------ Makarenkov, Vladimir PK-4815 Enseignement ------------- Remita, Mohamed Amine Groupes: 030 Les étudiants doivent consulter régulièrement leur courriel UQAM, moyen de communication du professeur avec le groupe-cours. Information =========== Microsoft TEAMS --------------- Toutes les discussions relatives au cours se feront sur le groupe TEAMS **221-BIF7101-030** Zoom ---- Pour l'instant, il y a un seul lien Zoom pour tous les cours et rencontres : Description du cours ==================== Ce cours vise à étudier des algorithmes, techniques et ressources logicielles appliquées aux structures en biologie moléculaire (arbres de phylogénie, structures tridimensionnelles des familles de protéines, réseaux). Sommaire du contenu ------------------- Construction des arbres de phylogénie. Prédiction de la structure secondaire de l'ARN et algorithmes de repliement. Comparaison des structures secondaires de l'ARN. Structures des protéines (secondaire, tertiaire, quaternaire). Classification des protéines. Interactions entre protéines. Visualisation des protéines. Simulation des voies de régulation. Ordinateurs biologiques. Préalables académiques ---------------------- - Bonne compréhension des algorithmes de bases, et des principes fondamentaux de la biologie moléculaire (ARN, ADN, Protéines). - Programmation de base en Python. Modalités d'évaluation ====================== Outil d'évaluation Pondération Échéance ---------------------------------------- ------------- ------------------------ Résumé du projet 5% 16 février (semaine 6) TP 1 Phylogénie 20% 9 mars (semaine 8) TP 2 ARNs et apprentissage automatique 20% 13 avril (semaine 13) Présentation orale du projet 15% 27 avril (semaine 15) Projet de session 40% 1 mai (semaine 15) Travaux pratiques (TPs) ----------------------- Les TPs seront de exercices qui touchent directement la matière enseignée les semaines précédentes. Les énoncés seront donnés quatre semaines avant la date de remise. Les travaux pratiques doivent être faits individuellement et remis sous format éléctronique sur Moodle. Même si les TPs doivent être fait individuellement, je vous encourage à discuter entre vous. Par contre, ces discussions ne doivent pas partager directement des solutions complêtes. Je vous demande d'indiquer sur vos soumissions le noms des personnes avec qui vous avez discuté durant vos TPs. Projet de session ----------------- Les projets de session sont à faire en équipe de deux étudiant-e-s. Le sujet du projet sera choisi parmi une liste de projets proposés au début de la session. Les équipes ont la posssibilité de proposer un article récent afin de reproduire les résultats. Les équipes devront choisir et définir un projet au plus tard le **2 février 2022**. Un résumé de projet doit être remis au plus tard le **16 février 2022**. Le résumé (de 400 mots maximum, rédigé en Latex) décrira la motivation du projet, la problématique à étudier et la méthodologie à utiliser pour réaliser le projet. Chaque équipe devra rencontrer le professeur au moins une fois durant la session pour discuter l'avancement de son projet. Une date sera déterminée en février. Le projet réalisé sera livré de deux façons : un exposé en classe de 15 minutes le **27 avril 2022**, puis un rapport écrit sous forme d'article (en format **PDF**) à remettre au plus tard le **1 mai 2022** sur Moodle. Vous devez remettre toutes les annexes que vous avez générées dans un dossier compressé (.zip ou .tar.gz). N'oubliez pas de bien les identifier et les commenter. Le rapport principal doit être rédigé en Latex. Il sera de 6 pages à double colonne maximum et comprendra les sections suivantes : 1. Résumé de votre étude 2. Introduction 3. Méthodologie 4. Résultats et discussions 5. Conclusion 6. Références Chacune de ces sections devra avoir les références appropriés provenant de la littérature scientifique. Wikipedia ne doit pas être cité, mais est une très bonne ressource afin de trouver des articles pertinants. Calendrier détaillé du cours ============================ ------------------------------------------------------------------------ Séance Date Activités ------------ ------------------------------- --------------------------- 1 12 janvier 2022 Plan de cours, introduction, contexte, problèmes. Introduction à la phylogénie 2 19 janvier 2022 Phylogénie : Modèles d'évolution. Méthodes de distance 3 26 janvier 2022 Phylogénie : Méthode du maximum de parcimonie. Exploration topologies. **Choix projet** 4 2 février 2022 Phylogénie : Méthode du maximum de vraisemblance. Tests de robustesse 5 9 février 2022 Phylogénie : Méthode Bayésienne. réseaux phylogénétique. **Présentation du TP 1** 6 16 février 2022 ARN : Prédiction des structures secondaires. **Remise du résumé de projet** 7 23 février 2022 ARN : miARN. Prédiction à grande échelle -- 2 mars 2022 Relache 8 9 mars 2022 Apprentissage automatique : Sructure de données. Prétraitement de données **Remise du TP 1** 9 16 mars 2022 Apprentissage automatique : Apprentissage supervisé. **Présentation du TP 2** 10 23 mars 2022 Apprentissage automatique : Apprentissage non supervisé. Évaluation de l'apprentissage 11 30 mars 2022 Apprentissage automatique : Applications en bioinformatique (Partie 1) 12 6 avril 2022 Apprentissage automatique : Applications en bioinformatique (Partie 2) 13 13 avril 2022 Protéines : Structures, prédiction et visualisation. **Remise du TP 2** 14 20 avril 2022 Protéines : Réseaux d'intéraction. 15 27 avril 2022 **Présentations orales des projets de session** ------------------------------------------------------------------------ Médiagraphie ============ - Joseph Felsenstein, Inferring Phylogenies, Sinauer Associates, 2003 - Daniel H. Huson, Regula Rupp, Celine Scornavacca, Phylogenetic Networks: Concepts, Algorithms and Applications, Cambridge University Press, 2011. - Peter Clote and Rolf Backofen, Computational Molecular Biology: An Introduction, Wiley, 2000. - Richard Durbin, Sean R. Eddy, Anders Krogh, and Graeme Mitchison, Biological Sequence Analysis, Cambridge University Press, 1998. - Jan Gorodkin and Walter Russo, RNA Sequence, Structure, and Function: Computational and Bioinformatics Methods, Humana Press, 2014. - Ameres, S. L., & Zamore, P. D. (2013). Diversifying microRNA sequence and function. Nature reviews Molecular cell biology, 14(8), 475-488. - Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning (2ème éd.). New York, NY, États-Unis : Springer - Pang-Ning, T., Steinbach, M., & Kumar, V. (2006). Introduction to data mining. Boston, MA, États-Unis : Pearson. - Cornuéjols A., & Miclet L. (2010). Apprentissage artificiel - Concepts et algorithmes (2ème éd.). Paris, France : Eyrolles. - Thomas E. Creighton, Proteins: structures and molecular properties, W. H. Freeman, 1993 - Newman, M. E. (2003). The structure and function of complex networks. SIAM review, 45(2), 167-256.