% INF4500 — Bioinformatique % UQAM — Département d'informatique % Plan de cours — Automne 2022 * Horaires, locaux et enseignants: * Site web du cours: Responsable(s) du cours ======================= Coordination ------------ Reinharz, Vladimir Enseignement ------------- Diallo, Abdoulaye Baniré PK-4535 Groupes: 010 Reinharz, Vladimir PK-4320 Groupes: 010 Communication ============= Les étudiants doivent consulter régulièrement leur courriel UQAM, moyen de communication du professeur avec le groupe-cours. Le site web officiel du cours est sur \[Moodle\], il contient le matériel du cours (diapositives, vidéos, etc...) et servira pour les évaluations en ligne (quiz, remises de TP, etc.). - Un [canal de discussion](https://mattermost.info.uqam.ca/signup_user_complete/?id=war7i8eq43r3tdtjizuebpemxh) en ligne est disponible pour interagir avec les enseignants, démonstrateurs et les autres étudiants. - Pour des questions personnelles ou pour relancer, contactez les enseignants par courriel. - Pour les questions d'ordre général, utilisez ce canal Mattermost, attendez un délai de quelques jours avant de relancer. **Aucune question ne sera répondue en privé si elle n'a pas été posé sur le canal de discussion en premier**. - Aucune remise de TP par courriel n'est acceptée. - Une réponse sera donnée au plus en 48h ouvrable. Description du cours ==================== Initier l'étudiant aux concepts, outils et techniques de la bioinformatique. Relations entre l'informatique et la biologie. Nature et diversité des informations biologiques. Utilisation des ressources (informationnelles et logicielles) disponibles sur le Web. Algorithmes et heuristiques pour la comparaison et l'alignement de séquences biologiques. Assemblage et regroupement de séquences biologiques. Méthodes pour la comparaison de génomes. Introduction à la phylogénie, algorithmes et construction d'arbres et de réseaux. Algorithmes pour la détection et la comparaison de structure d'ARN. Ce cours comporte une séance obligatoire de laboratoire (deux heures). Préalable académique -------------------- - Structures de données et algorithmes Objectifs du cours ================== À la fin du cours, l'étudiante ou l'étudiant sera capable de : - Connaître les problèmes actuels en bioinformatique. - Connaître les principaux algorithmes utilisés en bioinformatique, les implémenter, et analyser leur complexité. - Utiliser les ressources disponibles sur le Web, et avoir un regard critique sur la façon dont les données sont générées. - Développer des applications bioinformatiques. - Pouvoir lire des articles techniques en bioinformatique. Contenu du cours ================ - Évolution - Alignement de séquences: global, local, multiples, recherche heuristiques, assemblage de génome - Phylogénie - Structure de protéines - Modèle de Markov caché: automates, algorithme de Virterbi, profile de séquence - Partitionnement de données: analyse en composantes principales et populations génétiques - Structures de molécules ARN: structure secondaire, algorithme de Nussinov, distribution de Boltzmann et échantillonage Séances de laboratoires ======================= Les laboratoires se font principalement dans un environnement Linux et servent à: - Expérimenter les concepts et outils vus en cours - Approfondir l'utilisation de certains outils - Présenter de la matière technique nouvelle qui ne sera pas vue en classe - Offrir un support pour la réalisation des travaux pratiques De la matière uniquement vue en laboratoire pourra faire partie des évaluations. Les heures de laboratoires pouront etre utilisées pour des évaluations synchrones. Formule pédagogique et matériel requis ====================================== - Les cours et les démonstrations auront lieu aux jours et heures indiqués dans la description générale du cours fournie ici : https://etudier.uqam.ca/cours?sigle=INF4500. - Si nous devons passer en ligne, vous devrez obligatoirement **activer votre caméra** lors de l'évaluation orale. Cela peut-être une caméra de téléphone, webcam, tablette, mais **une caméra est obligatoire sinon une note de zéro sera attribué**. Modalités d'évaluation ====================== Outil d'évaluation Pondération Échéance -------------------- ------------- ------------- Travail pratique 1 20% Semaines 6 Travail pratique 2 20% Semaines 12 Examen intra 30% Semaines 7 Examen Final 30% Semaines 15 Les remises des TP se font électroniquement sur Moodle. Plusieurs remises peuvent être faites, seule la plus récente sera considérée. Il y aura une pénalité de *(10x2\^(j-1))%* par jours *j* de retard (10%, 20%, 40%, 80%). **Tous les travaux doivent être remis sous format PDF, et le code doit être exécutable / compilable sur java.labunix.uqam.ca** . Les examens intra et finaux seront en classe et porteront sur le contenu du cours et des laboratoires. Règles concernant le seuil de passage ------------------------------------- L'étudiant doit obtenir - Une moyenne à l'examen orale supérieur à 50% - **et** une moyenne générale pondérée (Laboratoires, TP et examens) supérieure ou égale à 50% Si ces seuils ne sont pas atteints, la mention échec sera automatiquement attribuée au cours. Horaire détaillé ================ nb Cours Laboratoire ---- ---------------------------------------------- -------------------------------------- 1 Pas de cours Intro. Python 2 Intro bio. + stat et thm de Bayes Labo 1 3 Prog. dyb., alignment de séquences Labo 2 4 Alignement multiple de séquences + TP 1 Labo 3 5 Assemblage de génomes, BLAST Labo 4 6 BLAST et heuristiques de recherche Labo 5 (remise TP 1 dimanche) 7 Examen Intra 8 Structure secondaire d'ARN et Boltzmann Labo 6 9 Chaines de Markov Labo 7 10 Modèle de Markov caché et profiles Labo 8 11 Phylogénie Labo 9 12 Génétique des populations Question TP 2 (remise TP 2 dimanche) 13 Structure de protéines Labo 10 14 Apprentissage automatique en bioinformatique Labo 11 15 Examen Final Examen Final Médiagraphie ============ Tout le matériel nécessaire sera présenté en classe. Ressources complémentaires -------------------------- Références principales : - Richard Durbin, Sean R. Eddy, Anders Krogh, and Graeme Mitchison, Biological Sequence Analysis, Cambridge University Press, 1998. - Yann Ponty, Vladimir Reinharz, Chapitre [Repliement de l'ARN](https://hal.inria.fr/hal-02864246/file/Chapitre_ISTE%283%29.pdf) Quelques références supplémentaires sont : - Daniel H. Huson, Regula Rupp, Celine Scornavacca, Phylogenetic Networks: Concepts, algorithms, and applications, Cambridge University Press, 2011. - Peter Clote and Rolf Backofen, Computational Molecular Biology: An Introduction, Wiley, 2000. - Jan Gorodkin and Walter Russo, RNA Sequence, Structure, and Function: Computational and Bioinformatics Methods, Humana Press, 2014. - Thomas E. Creighton, Proteins: structures and molecular properties, W. H. Freeman, 1993 - Pavel Pevzner, Computational molecular biology: an algorithmic approach, 2000