% BIF4100 — Introduction à la bioinformatique % UQAM — Département d'informatique % Plan de cours — Automne 2019 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Coordination ------------ Makarenkov, Vladimir PK-4815 poste 3870 Enseignant(s) ------------- Tahiri, Nadia PK-4660 poste 4803 Description du cours ==================== Ce cours permettra à l'étudiant de connaître les principaux outils informatiques utilisés pour le traitement des données associées aux analyses de l'ADN génomique, de molécules d'ADN complémentaires et de protéines. L'étudiant apprendra comment utiliser ces outils afin d'en retirer l'information pertinente pour répondre à des questions biologiques précises. Sommaire du contenu ------------------- Ce cours présente les principaux algorithmes, techniques et ressources logicielles couramment utilisés pour les comparaisons et les alignements (simples et multiples) de séquences d'ADN et de protéines, et pour l'interrogation des bases de données et autres ressources en biologie disponibles sur le Web. Le cours traite aussi du séquençage et de l'assemblage de biomolécules (ADN, ARN, protéines), du traitement des données de transcriptomes, de prédiction et d'annotation des séquences fonctionnelles, d'épissage alternatif, et de réarrangements et comparaison de génomes. Modalité d'enseignement ----------------------- Ce cours se déroule dans une salle du laboratoire informatique. Préalables académiques ---------------------- - BCB2240 - Génétique et biologie moléculaire (peut être concomitant) Objectifs du cours ================== À la fin du cours, l'étudiant-e sera capable de : - Connaître les principes de base de la bioinformatique; - Présentation des différentes techniques d'assemblage de séquences; - Connaître les principales bases de données et outils existants pour l'analyse de séquences d'ADN; - Connaître les différentes structures des génomes; - Apprentissage des méthodes de comparaison de génomes; Contenu du cours ================ Ce cours est divisé en cinq grands chapitres. Dans chaque chapitre, nous définirons la problématique de base, donnerons un aperçu des principaux algorithmes, exacts ou heuristiques, et apprendrons à utiliser les outils informatiques disponibles. Chapitre 1 : Séquences biologiques et banques de données bioinformatiques ------------------------------------------------------------------------- Types de séquences, diversité des bases de données de séquences. Problèmes informatiques liés au séquençage de nucléotides, séquençage direct, séquençage aux deux extrémités, séquençage par hybridation, séquençage de seconde et troisième générations. Techniques d'assemblage de fragments. Séquençage de protéines. Chapitre 2 : Comparaison de séquences ------------------------------------- Techniques de comparaison de séquences. Alignement de paires de séquences, distance et similarité. Comparaisons globales et locales. Brèches et matrices de score. Alignements multiples de séquences. Algorithmes de programmation dynamique, heuristiques. Chapitre 3 : Structures des génomes ----------------------------------- Anatomie des génomes procaryotes et eucaryotes. Virus. Prédiction de gènes, annotations. Profils de séquences. Densité des gènes. Domaines. Éléments répétitifs, satellites. Opérons. Chapitre 4 : Expression des gènes --------------------------------- Transcription, traduction, régulation. Transcription alternative. Définition de gène. Outils et bases de données. Chapitre 5 : Génomique comparée ------------------------------- Principales opérations de réarrangements. Transferts horizontaux. Duplications et perte de gènes. Famille de gènes. Gènes orthologues et paralogues. Polymorphismes. Haplotypes. Identification d'unités fonctionnelles. Facteurs de transcription et sites de liaison. Synténies. Métagénomique. Modalités d'évaluation ====================== Outil d'évaluation Pondération Échéance ---------------------------------------- ------------- ----------------- Revue d'outil bioinformatique: Oral 20% Semaines 8 et 9 Revue d'outil bioinformatique: Rapport 20% Semaine 10 Travail pratique 1 20% Semaine 12 Examen final 40% Semaine 15 Oral ---- Les projets à étudier seront distribués 4 semaines avant la date de présentation. Chaque exposé aura une durée de 20 minutes avec un support électronique suivi d'une période de questions. Ce travail se fera en équipe de deux ou trois étudiants-es. Rapport ------- Le rapport sera de 12 pages maximum comprenant les sections suivantes : - Un résumé de votre étude (1/2 page) - Introduction (2 pages) - Méthodologie (2 à 3 pages) - Résultats et discussions (4 à 5 pages) - Conclusion (1page) - Références (1 page) Travail pratique 1 ------------------ La remise du TP1 se fera électroniquement (les détails techniques seront donnés en classe). Plusieurs remises peuvent être faites, seule la plus récente sera considérée. Aucun retard ne sera accepté pour le TP. Examen écrit ------------ Un examen écrit de 3h aura lieu à la semaine 15. Médiagraphie ============ Il n'y a pas de manuels obligatoires pour ce cours. Cependant, des chapitres de livres et articles scientifiques seront mis à la disposition des étudiants-es tout au long de la session. Quelques exemples : ------------------- - Pevsner, J., Bioinformatics and Functional Genomics. - Golding, B., Morton, D. and Haerty, W. -- Elementary Sequence Analysis. - Pevzner, P. and Shamir, R. -- Bioinformatics for biologists