% INF4500 — Bioinformatique % UQAM — Département d'informatique % Plan de cours — Automne 2021 * Horaires, locaux et enseignants: * Site web du cours: Responsable(s) du cours ======================= Coordination ------------ Reinharz, Vladimir PK-4320 Enseignement ------------- Reinharz, Vladimir Communication ============= Les étudiants doivent consulter régulièrement leur courriel UQAM, moyen de communication du professeur avec le groupe-cours. Le site web officiel du cours est sur [Moodle](https://ena01.uqam.ca/course/view.php?id=44428), il contient le matériel du cours (diapositives, vidéos, etc...) et servira pour les évaluations en ligne (quiz, remises de TP, etc.). - Un [canal de discussion](https://mattermost.info.uqam.ca/signup_user_complete/?id=6no47wke4jfrbkk4s4d495ot4h) en ligne est disponible pour interagir avec les enseignants, démonstrateurs et les autres étudiants. - Pour des questions personnelles ou pour relancer, contactez les enseignants par courriel. - Pour les questions d'ordre général, utilisez ce canal Mattermost, attendez un délai de quelques jours avant de relancer. **Aucune question ne sera répondu en privé si elle n'a pas été posé sur le canal de discussion en premier**. - Aucune remise de TP par courriel n'est acceptée. - Une réponse sera donné au plus en 48h ouvrable. Description du cours ==================== Initier l'étudiant aux concepts, outils et techniques de la bioinformatique. Relations entre l'informatique et la biologie. Nature et diversité des informations biologiques. Utilisation des ressources (informationnelles et logicielles) disponibles sur le Web. Algorithmes et heuristiques pour la comparaison et l'alignement de séquences biologiques. Assemblage et regroupement de séquences biologiques. Méthodes pour la comparaison de génomes. Introduction à la phylogénie, algorithmes et construction d'arbres et de réseaux. Algorithmes pour la détection et la comparaison de structure d'ARN. Ce cours comporte une séance obligatoire de laboratoire (deux heures). Préalable académique -------------------- - Structures de données et algorithmes Objectifs du cours ================== À la fin du cours, l'étudiante ou l'étudiant sera capable de : - Connaître les problèmes actuels en bioinformatique. - Connaître les principaux algorithmes utilisés en bioinformatique, les implémenter, et analyser leur complexité. - Utiliser les ressources disponibles sur le Web, et avoir un regard critique sur la façon dont les données sont générées. - Développer des applications bioinformatiques. - Pouvoir lire des articles techniques en bioinformatique. Contenu du cours ================ - Évolution - Alignement de séquences: global, local, multiples, recherche heuristiques, assemblage de génome - Phylogénie - Structure de protéines - Modèle de Markov caché: automates, algorithme de Virterbi, profile de séquence - Partitionnement de données: analyse en composantes principales et populations génétiques - Structures de molécules ARN: structure secondaire, algorithme de Nussinov, distribution de Boltzmann et échantillonage Séances de laboratoires ======================= Les laboratoires se font principalement dans un environnement Linux et servent à: - Expérimenter les concepts et outils vus en cours - Approfondir l'utilisation de certains outils - Présenter de la matière technique nouvelle qui ne sera pas vue en classe - Offrir un support pour la réalisation des travaux pratiques Certains **laboratoires seront notés**. De plus, de la matière uniquement vue en laboratoire pourra faire partie des évaluations. Les heures de laboratoires pouront etre utilisées pour des évaluations synchrones. Formule pédagogique et matériel requis ====================================== - Les cours et les démonstrations auront lieu aux jours et heures indiqués dans la description générale du cours fournie ici : https://etudier.uqam.ca/cours?sigle=INF4500. - Si nous devons passer en ligne, vous devrez obligatoirement **activer votre caméra** lors de l'évaluation orale. Cela peut-être une caméra de téléphone, webcam, tablette, mais **une caméra est obligatoire sinon une note de zéro sera attribué**. Modalités d'évaluation ====================== Outil d'évaluation Pondération Échéance ----------------------------- ------------- -------------------------------------- Labo 1 2% Semaine 2 Labo 2 2% Semaine 3 Labo 3 2% Semaine 4 Labo 4 2% Semaine 5 Labo 5 2% Semaine 7 Labo 6 2% Semaine 8 Labo 7 2% Semaine 10 Labo 8 2% Semaine 11 Labo 9 2% Semaine 13 Labo 10 2% Semaine 14 Meilleurs 8 Labo a remettre 16% Travail pratique 1 20% Semaines 6 Travail pratique 2 20% Semaines 9 Travail pratique 3 20% Semaines 12 Examen oral 24% Semaines du 15 et 16 (cours et labo) Les labos seront disponible le mercredi matin et devront être remis le dimanche de la même semaine sur Moodle.\ Les meilleurs des 8 laboratoires seront évalués. Les remises des TP se font électroniquement sur Moodle. Plusieurs remises peuvent être faites, seule la plus récente sera considérée. Il y aura une pénalité de *(10x2\^(j-1))%* par jours *j* de retard (10%, 20%, 40%, 80%). **Tous les travaux doivent être remis sous format PDF, et le code doit être exécutable / compilable sur java.labunix.uqam.ca** . L'examen oral sera sur rendez-vous durant un moment choisi **avant la semaine 12** (prévoir 30min). Il portera sur tout le contenu du cours et laboratoires. Règles concernant le seuil de passage ------------------------------------- L'étudiant doit obtenir - Une moyenne à l'examen orale supérieur à 50% - **et** une moyenne générale pondérée (Laboratoires, TP et examens) supérieure ou égale à 50% Si ces seuils ne sont pas atteints, la mention échec sera automatiquement attribuée au cours. Horaire détaillé ================ \# Cours Laboratoire ---- --------------------------------------------------------------- --------------------------------------- 1 Pas de cours Intro. Python 2 Introduction à la biologie + statistique et théorème de Bayes Labo 1 3 Programmation dynamique, alignment de séquences Labo 2 4 Alignement multiple de séquences + TP 1 Labo 3 5 BLAST et heuristiques de recherche Labo 4 6 Pas de cours Questions TP 1 (remise TP 1 dimanche) 7 Languages et structure secondaire d'ARN + TP 2 Labo 5 8 Structures d'ARN et distribution de Boltzmann Labo 6 9 Chaines de Markov Questions TP 2 (remise TP 2 dimanche) 10 Modèle de Markov caché et profiles + TP 3 Labo 7 11 Phylogénie Labo 8 12 Génétique des populations Question TP 3 (remise TP 3 dimanche) 13 Structure de protéines Labo 9 14 Évolution et periode de révision Labo 10 15 Examen oral Examen oral 16 Examen oral Examen oral Médiagraphie ============ Tout le matériel nécessaire sera présenté en classe. Ressources complémentaires -------------------------- Références principales : - Richard Durbin, Sean R. Eddy, Anders Krogh, and Graeme Mitchison, Biological Sequence Analysis, Cambridge University Press, 1998. - Yann Ponty, Vladimir Reinharz, Chapitre [Repliement de l'ARN](https://hal.inria.fr/hal-02864246/file/Chapitre_ISTE%283%29.pdf) Quelques références supplémentaires sont : - Daniel H. Huson, Regula Rupp, Celine Scornavacca, Phylogenetic Networks: Concepts, algorithms, and applications, Cambridge University Press, 2011. - Peter Clote and Rolf Backofen, Computational Molecular Biology: An Introduction, Wiley, 2000. - Jan Gorodkin and Walter Russo, RNA Sequence, Structure, and Function: Computational and Bioinformatics Methods, Humana Press, 2014. - Thomas E. Creighton, Proteins: structures and molecular properties, W. H. Freeman, 1993 - Pavel Pevzner, Computational molecular biology: an algorithmic approach, 2000