4.00 crédits
15.0 h + 5.0 h
Q2
Enseignants
Symul Laura;
Langue
d'enseignement
d'enseignement
Français
Préalables
Concepts et outils équivalents à ceux enseignés dans les UEs
LSTAT2020 | Logiciels et programmation statistique de base |
LSTAT2110 | Analyse des données |
Thèmes abordés
- La normalisation de données omics (que ce soit génomiques ou métabolomique)
- Les méthodes mathématiques et statistiques pour le prétraitement de données spectrales (ex : modèles semi-paramétrique de lissage pour correction de ligne de base, alignement de pics)
- L'organisation d'expériences pour analyser la qualité informatique de données omics et leur analyse par modèles à composantes de variance, méthodes de classification et méthodes multivariées telles
- ASCA,ANOVA-PCA
- La modélisation de données de grande dimension dans un but de recherche de biomarqueurs ou de prédiction par modèle PLS, O-PLS, ICA, arbres de décision
- Les méthodes pour tests multiples (FDR)
- Les méthodes d'intégration de données (analyse de données multitableaux)
- Revue et utilisation des packages R les plus courants dans le domaine (ex : bioconductor)
- Application sur des bases de données réelles.
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 |
Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», cette activité permet aux étudiants de maîtriser
|
Contenu
Après avoir revu les bases de la biologie moléculaire, le cours présente une série de méthodes -omiques et surtout les méthodes de traitement de données liées:
- Bases de biologie moléculaire.
- Révision de méthodes multivariées utiles en méthodes -omiques (PCA, Clustering...) et appllication en R + RMarkdown.
- Méthode d'acquisition de données de transcriptomique (micro-damiers, q-PCR, RNA-Seq...).
- Prétraitement et analyse de données transcriptomiques (correction de background, normalisation,... + tests d'hypothèses avec correction de multiplicité).
- Utilisation de modèle de prédiction et classification émanant de la chimiomtrie et du machine learning pour l'analyse de données omique (PLS, O-PLS, arbres...).
- Acquisition et traitement de données protéomiques.
- Acquisition et traitement de données métabolomiques (dont prétraitement détaillé de données 1H-NMR).
- Traitement de données métagénomiques.
Méthodes d'enseignement
Le cours est composé d'une série d'activité qui amènent l'étudiant à se plonger activement dans le monde des données -omiques. Il propose:
- des exposées par des spécialistes actifs dans le domaine,
- des mini-projets de traitement de données à réaliser chaque semaine,
- un travail interactif sur ordinateur durant le cours,
- une visite de laboratoire,
- un projet final sur des données proposées par les différents intervenants du cours ou de data repositories.
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
Dans le cadre de ce cours, les étudiant·es sont évalué·es de deux manières :
- l’évaluation continue certificative incluant:
- des travaux obligatoires à remettre en cours de quadrimestre selon un calendrier fixé en début de quadrimestre (40% de la note finale)
- et un projet final à présenter oralement lors du dernier cours (40% de la note finale)
- un examen oral à livre ouvert (20% de la note finale)
Ressources
en ligne
en ligne
Site Moodle: https://moodleucl.uclouvain.be/course/view.php?id=10846
Faculté ou entité
en charge
en charge
LSBA
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en science des données, orientation statistique
Master [120] en statistique, orientation biostatistiques
Master [120] en statistique, orientation générale
Master [120] : bioingénieur en chimie et bioindustries
Certificat d'université : Statistique et science des données (15/30 crédits)
Master [120] : bioingénieur en sciences agronomiques