Traitement statistique des données -omiques

lstat2340  2020-2021  Louvain-la-Neuve

Traitement statistique des données -omiques
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
4 crédits
15.0 h
Q2
Langue
d'enseignement
Français
Préalables
Les cours LSTAT2020 Calcul statistique sur ordinateur, LSTAT2110 Analyse des données et LSTAT2120 Modèles linéaires doivent être acquis.
Thèmes abordés
  • La normalisation de données omics (que ce soit génomiques ou métabolomique)
  • Les méthodes mathématiques et statistiques pour le prétraitement de données spectrales (ex : modèles semi-paramétrique de lissage pour correction de ligne de base, alignement de pics)
  • L'organisation d'expériences pour analyser la qualité informatique de données omics et leur analyse par modèles à composantes de variance, méthodes de classification et méthodes multivariées telles
  • ASCA,ANOVA-PCA
  • La modélisation de données de grande dimension dans un but de recherche de biomarqueurs ou de prédiction par modèle PLS, O-PLS, ICA, arbres de décision
  • Les méthodes pour tests multiples (FDR)
  • Les méthodes d'intégration de données (analyse de données multitableaux)
  • Revue et utilisation des packages R les plus courants dans le domaine (ex : bioconductor)
  • Application sur des bases de données réelles.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.4, 2.2, 2.5, 2.6, 3.1, 3.2, 3.3, 3.4, 3.5, 4.5, 5.1, 5.2, 5.6
  • De manière secondaire les AA suivants: 4.1, 5.7
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 1.4, 2.2, 2.4, 2.5, 2.6, 3.1, 3.2, 3.3, 3.4, 5.1, 5.5, 5.6
  • De manière secondaire les AA suivants : 1.2, 1.5, 4.1
 
Contenu
Après avoir revu les bases de la biologie moléculaire, le cours présente une série de méthodes -omiques et surtout les méthodes de traitement de données liées:
  • Bases de biologie moléculaire.
  • Révision de méthodes multivariées utiles en méthodes -omiques (PCA, Clustering...) et appllication en R + RMarkdown.
  • Méthode d'acquisition de données de transcriptomique (micro-damiers, q-PCR, RNA-Seq...).
  • Prétraitement et analyse de données transcriptomiques (correction de background, normalisation,... + tests d'hypothèses avec correction de multiplicité).
  • Utilisation de modèle de prédiction et classification émanant de la chimiomtrie et du machine learning pour l'analyse de données omique (PLS, O-PLS, arbres...).
  • Acquisition et traitement de données protéomiques. 
  • Acquisition et traitement de données métabolomiques (dont prétraitement détaillé de données 1H-NMR). 
  • Traitement de données métagénomiques.  
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Le cours est composé d'une série d'activité qui amènent l'étudiant à se plonger activement dans le monde des données -omiques.  Il propose:
  • des exposées par des spécialistes actifs dans le domaine,
  • des mini-projets de traitement de données à réaliser chaque semaine,
  • un travail interactif sur ordinateur durant le cours, 
  • une visite de laboratoire,
  • un projet final sur des données proposées par les différents intervenants du cours ou de data repositories.
Les modalités prévues évolueront en fonction de la situation sanitaire.
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Le cours est évalué sur base
  • De mini-projets à rendre chaque semaine durant l'année.
  • D'un projet final et d'une présentation orale liée.
  • D'un examen oral (à documents ouverts).
Ressources
en ligne
Site Moodle: https://moodleucl.uclouvain.be/course/view.php?id=10846
Faculté ou entité
en charge
Force majeure
Modes d'évaluation
des acquis des étudiants
La crise sanitaire implique des incertitudes quant aux modalités d’évaluation en particulier pour la session de juin. La modalité retenue pour ce cours est :
  • Examen oral sur Teams
  • Travail à remettre par mail


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] : bioingénieur en sciences agronomiques

Master [120] en statistique, orientation générale

Master [120] en statistique, orientation biostatistiques