BIF7105 — Méthodes statistiques en bioinformatique (UQAM)

BIF7105 - Méthodes statistiques en bioinformatique

Plan de cours Automne 2021

Horaires, locaux et enseignants
Version PDF du plan de cours

Responsable(s) du cours

Coordination

Makarenkov, Vladimir
PK-4815
makarenkov.vladimir@uqam.ca
https://www.labunix.uqam.ca/~makarenkov_v/site_web/index.html

Enseignement

Mazoure, Bogdan
PK-4660
mazoure.bogdan@uqam.ca
Groupes: 040

Description du cours

Fournir les bases statistiques pour énoncer les hypothèses statistiques et exécuter les tests qui s’appliquent à des problèmes de bioinformatiques.

Préalables académiques :

Rappel des principes de base en probabilité et en statistique. Inférence statistique classique et bayésienne. Processus stochastiques : promenades aléatoires, processus de Poisson, chaines de Markov. Algorithme BLAST (“Basic Local Alignment Search Tool”). Modèles d’évolution.

Objectif du cours

  1. Appliquer et comprendre les bases statistiques en bioinformatique pour énoncer des hypothèses.

  2. Apprendre le langage R et développer des fonctions d’analyse.

Modalités d’évaluation

ÉVALUATIONS DATES DE REMISE PONDÉRATION
Examen de mi-session 03 novembre 30%
T.P. (devoir) 01 décembre 30%
Projet de session 17 décembre 30%
Présentation 15 décembre 10%

TRAVAUX PRATIQUES (T.P.)

Le T.P. sera une suite de petits exercices qui touchent directement la matière enseignée les semaines précédentes. Les énoncés seront donnés trois semaines avant la date de remise, soit le 10 NOVEMBRE 2021. Les travaux pratiques doivent être faits individuellement et remis sous format éléctronique.

PROJET DE SESSION

Les projets de session sont à faire en ÉQUIPE DE DEUX OU TROIS ÉTUDIANTS. Les équipes devront définir et envoyer un énoncé de projet au plus tard le 10 novembre 2021. Chaque équipe devra rencontrer le professeur au moins une fois durant la session pour discuter l’avancement de leur projet.

Le projet réalisé sera livré de deux façons : un exposé en classe de 10-15 MINUTES (5 minutes par personne) le 15 décembre 2021, puis un rapport écrit sous forme d’article à remettre le 17 décembre 2021. Vous devez remettre toutes les annexes que vous avez générées dans un dossier compressé (.zip ou .tar.gz). N’oubliez pas de bien les identifier et les commenter.

Le rapport principal sera de 9 pages maximum et comprendra les sections suivantes :

  1. Un résumé de votre étude (1/2 page)

  2. Une introduction avec les références pertinentes (1 page)

  3. Méthodologie (2 à 3 pages)

  4. Résultats et discussions (2 à 3 pages)

  5. Conclusion (1/2 page)

  6. Références en écartant les références de Wikipedia (1 page maximum)

EXEMPLE DE TRAVAUX ADMISSIBLES

  1. Révision critique d’un outil bioinformatique (ou package R): description de l’application et des jeux de données, de la problématique, des tests d’hypothèses et de la méthode statistique. Inclusion d’un exemple pratique.

  2. Révision des techniques statistiques utilisées dans un sujet d’intérêt en bioinformatique p.ex. la phylogénie, la variation génétique, l’épidémiologie, l’écologie, etc.

Calendrier

Semaine Date Activité
1 8 septembre Présentation du cours, introduction aux statistiques, concept de probabilité, méthode scientifique, mesures de tendance centrale, mesures de dispersion et de position . Présentation de l’environnement de programmation et introduction aux concepts algorithmiques
2 15 septembre Introduction au langage R avec RStudio, en R : Introduction aux structures de données : vecteurs, data.frame et matrices, lecture de fichiers, calculs simples et sorties graphiques
3 22 septembre Distributions de probabilité (loi de Poisson, loi normale, loi de Student), tests d’hypothèses, notion de degrés de liberté
4 29 septembre Analyse de variance (ANOVA), test de normalité, analyse factorielle (ANOVA à plusieurs facteurs)
5 6 octobre Langage R avec RStudio : Opérations sur les listes, structures de contrôle et fonctions, tests statistiques en R
6 13 octobre Régressions simples et multiples
7 20 octobre Langage R avec RStudio : ANOVA et régression dans R
8 27 octobre Chaînes de Markov et théorie de l’échantillonage, théorème de Bayes et p-value
9 3 novembre Examen de mi-session
10 10 novembre Langage R avec RStudio : Analyse Bayésienne et analyse par composantes principales (PCoA) et distribution du T.P.
11 17 novembre Simulations Monte Carlo, tests de permutation, bootstrap, concept de Likelihood
12 24 novembre Langage R avec RStudio : Quantitative structure-activity relationship - QSAR
13 1 décembre Langage R avec RStudio : Simulations de Monte Carlo, échantillonnage aléatoire, bootstrap, réalisation de rapports, présentations avec Knitr et remise du T.P.
14 8 décembre Langage R avec RStudio : Classification hiérarchique (hclust) et par partitionnement et k-means
15 15 décembre Présentations orales

Médiagraphie

LOGICIEL

RStudio: https://www.rstudio.com/products/rstudio/download/ LO

LIVRES ET AIDE MÉMOIRE

Kauffman, M. (2009) AIDE MÉMOIRE R Référence des fonctions de R les plus courantes. (https://cran.r-project.org/doc/contrib/Kauffmann_aide_memoire_R.pdf) VO

Krijnen, W. P. (2009). Applied statistics for bioinformatics using R. Institute for Life Science and Technology, Hanze University. (https://cran.r-project.org/doc/contrib/Krijnen-IntroBioInfStatistics.pdf) VO

Laude, H. (2016). Data Scientist et langage R - Guide d’autoformation à l’exploitation des Big Data. ENI. VR

Paradis, E. (2005) R pour les débutants (https://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf) VO

Politique d’absence aux examens

Reprise d’examen

L’autorisation de reprendre un examen en cas d’absence est de caractère exceptionnel. Pour obtenir un tel privilège, l’étudiant-e doit avoir des motifs sérieux et bien justifiés.

Conflits d’horaire

Il est de la responsabilité de l’étudiant.e de ne pas s’inscrire à des cours qui sont en conflit d’horaire, tant en ce qui concerne les séances de cours ou d’exercices que les examens. De tels conflits d’horaire ne constituent pas un motif justifiant une demande d’examen de reprise.

Procédure

L’étudiant.e absent.e lors d’un examen doit, dans les cinq (5) jours ouvrables suivant la date de l’examen, présenter une demande de reprise en utilisant le formulaire prévu, disponible sur http://info.uqam.ca/repriseexamen/.

Pièces justificatives

Dans le cas d’une absence pour raison médicale, l’étudiant.e doit joindre un certificat médical original et signé par le médecin décrivant la raison de l’absence à l’examen. Les dates d’invalidité doivent être clairement indiquées sur le certificat. Une vérification de la validité du certificat pourrait être faite. Dans le cas d’une absence pour une raison non médicale, l’étudiant.e doit fournir les documents originaux expliquant et justifiant l’absence à l’examen ; par exemple, lettre de la Cour en cas de participation à un jury, copie du certificat de décès en cas de décès d’un proche, etc. Toute demande incomplète sera refusée. Si la direction du programme d’études de l’étudiant.e constate qu’un.e étudiant.e a un comportement récurrent d’absence aux examens, l’étudiant.e peut se voir refuser une reprise d’examen.

Pour plus d’informations

Consulter la page http://info.uqam.ca/politiques.

Règlement numéro 18 sur les infractions de nature académique (extraits)

Tout acte de plagiat, fraude, copiage, tricherie ou falsification de document commis par une étudiante, un étudiant, de même que toute participation à ces actes ou tentative de les commettre, à l’occasion d’un examen ou d’un travail faisant l’objet d’une évaluation ou dans toute autre circonstance, constituent une infraction au sens de ce règlement.

La liste non limitative des infractions est définie comme suit :

Les règlements concernant le plagiat seront strictement appliqués. Pour plus de renseignements :

Politique no 16 visant à prévenir et combattre le sexisme et les violences à caractère sexuel

Les violences à caractère sexuel se définissent comme étant des comportements, propos et attitudes à caractère sexuel non consentis ou non désirés, avec ou sans contact physique, incluant ceux exercés ou exprimés par un moyen technologique, tels les médias sociaux ou autres médias numériques. Les violences à caractère sexuel peuvent se manifester par un geste unique ou s’inscrire dans un continuum de manifestations et peuvent comprendre la manipulation, l’intimidation, le chantage, la menace implicite ou explicite, la contrainte ou l’usage de force.

Les violences à caractère sexuel incluent, notamment :

Pour consulter la politique no 16

https://instances.uqam.ca/wp-content/uploads/sites/47/2018/05/Politique_no_16.pdf

Pour obtenir de l’aide, faire une divulgation ou une plainte

Bureau d’intervention et de prévention en matière de harcèlement
514-987-3000, poste 0886

Pour obtenir la liste des services offerts à l’UQAM et à l’extérieur de l’UQAM

https://harcelement.uqam.ca

Soutien psychologique (Services à la vie étudiante)

514-987-3185
Local DS-2110

CALACS Trêve pour Elles – point de services UQAM

514 987-0348
calacs@uqam.ca
http://trevepourelles.org

Service de la prévention et de la sécurité

514-987-3131

Politique no 44 d’accueil et de soutien des étudiant.e.s en situation de handicap 

Politique

Par sa politique, l’Université reconnait, en toute égalité des chances, sans discrimination ni privilège, aux étudiant.e.s en situation de handicap, le droit de bénéficier de l’ensemble des ressources du campus et de la communauté universitaire, afin d’assurer la réussite de leurs projets d’études, et ce, dans les meilleures conditions possibles. L’exercice de ce droit est, par ailleurs, tributaire du cadre réglementaire régissant l’ensemble des activités de l’Université.

Responsabilité de l’étudiant.e

Il incombe aux étudiant.e.s en situation de handicap de rencontrer les intervenant.e.s (conseiller.ère.s à l’accueil et à l’intégration du Service d’accueil et de soutien des étudiant.e.s en situation de handicap, professeur.e.s, chargé.e.s de cours, direction de programmes, associations étudiantes concernées, etc.) qui pourront faciliter leur intégration à la communauté universitaire ou les assister et les soutenir dans la résolution de problèmes particuliers en lien avec les limitations entraînées par leur déficience.

Service d’accueil et de soutien aux étudiant.e.s en situation de handicap

Le Service d’accueil et de soutien aux étudiant.e.s en situation de handicap (SASESH) offre des mesures d’aménagement dont peuvent bénéficier certains étudiant.e.s. Il est fortement recommandé aux de se prévaloir de ces services afin de réussir ses études, sans discrimination. Pour plus d’information, visiter le site de ce service : https://vie-etudiante.uqam.ca/etudiant-situation-handicap/nouvelles-ressources.html et celui de la politique institutionnelle d’accueil et de soutien aux étudiant.e.s en situation de handicap : https://instances.uqam.ca/wp-content/uploads/sites/47/2018/05/Politique_no_44.pdf

Il est important d’informer le SASESH de votre situation le plus tôt possible :