La version que vous consultez n'est pas définitive.
Cette fiche d’activité peut encore faire l'objet de modifications. La version finale sera disponible le 1er juin.
5.00 crédits
30.0 h + 10.0 h
Q2
Langue
d'enseignement
d'enseignement
Français
> English-friendly
> English-friendly
Préalables
Concepts et outils équivalents à ceux enseignés dans les UEs
LSTAT2020 | Logiciels et programmation statistique de base |
LSTAT2110 | Analyse des données |
Thèmes abordés
- Introduction aux données omiques (définitions, motivations pour leur génération, exemples)
- Caractéristiques statistiques des données omiques (type et nature des données, distributions typiques, etc.)
- Méthodes de correction pour tests multiples
- Détails des protocoles expérimentaux et des méthodes de prétraitement et d’analyses de données omiques les plus courantes (transcriptomique, metabolomique, proteomique, metagenomique, cytométrie de flux, et single-cell transcriptomics)
- Revues des méthodes d’analyses multivariées supervisées (classification et régression, PLS(-DA), O-PLS, Lasso & ridge regression, SVM) et non-supervisée (PCA, MDS, clustering) et des modèles à composantes de variances (ASCA, APCA).
- Les méthodes d'intégration de données (analyse de données multitableaux)
- Les méthodes mathématiques et statistiques pour le prétraitement de données spectrales (ex : modèles semi-paramétrique de lissage pour correction de ligne de base, alignement de pics)
- Méthodes de correction d’effets de batch et planification expérimentale pour les éviter.
- Revue et utilisation des packages R pour l’analyse des données omiques (typiquement les packages BioConductor)
- Application sur des données réelles.
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», cette activité permet aux étudiants de maîtriser
|
Contenu
La plupart des chapitres sont construits autour d’une méthode omique d’intérêt et introduisent parallèlement les concepts statiques nécéssaires à l’analyse des données générées. Une ou deux études de cas seront présentées pour chaque chapitre et la plupart sont suivis d’un mini-projet (lui-même consistant en une petite analyse de cas) à réaliser seul ou en binome.
Partim A (3C, 20h + 8h)
Introduction
Metabolomique et méthodes d’analyses de données spectrale, méthodes d’analyse de variance multivariée
Partim A (3C, 20h + 8h)
Introduction
- Révision des bases de biologie moléculaire
- Introduction aux données omiques (Pourquoi? Comment? Quoi?)
- Reproducibilité scientifique et technique. Outils et bonnes pratiques pour améliorer la reproducibilité.
- Méthodes de quantifications d’ADN et d’ARN (qPCR, micro-array, séquençage)
- Méthodes de correction pour tests multiples
- Calibration, contrôles positifs et négatifs, régression robuste
- Modélisation statistique pour l’analyse d’expression différentielle entre 2 ou plusieurs conditions (glm, negative binomial glm, etc).
- Introduction aux microbiotes et aux méthodes de génération de données pour la quantification de la composition des microbiotes
- Distances adaptées pour les données écologiques
- Dimension de réduction et projections de matrices de distance (MDS)
- Méthodes de classifications multivariées
- Méthodes de régression multivariées
- Méthodes d’acquisition de données protéomiques
- Méthodes de prétraitement et d’analyse de données protéomiques
- Méchanismes de génération des données manquantes et méthodes d’imputation
Metabolomique et méthodes d’analyses de données spectrale, méthodes d’analyse de variance multivariée
- Introduction à la métabolomique et méthodes de quantification des métabolites
- Focus sur les méthodes 1H-RMN et les méthodes de pré-traitement associées
- Méthodes d’analyse de variance multivariée (ASCA, APCA)
- Définition des effets de groupe/lot (batch effects).
- Méthodes de correction des effets de groupe
- Prévenir la confusion entre effets techniques (e.g., batch effects) et les effets biologiques
- Cytométrie de flux
- Techniques de génération de données
- Contrôle de qualité
- Pré-traitement et analyse statistique des données
- Single-cell transcriptomics
- Techniques de génération de données
- Pré-traitement et analyse statistique des données
- Méthode de réduction de dimension non-linéaires
- Buts et motivations
- Méthodes d’intégration supervisées
- Méthodes d’intégration non-supervisées
- Buts et motivations
- Évaluer la qualité des données simulées
- Exemples d’analyse de puissance par simulation.
Méthodes d'enseignement
Le cours est composé d'une série d'activité qui amènent l'étudiant à se plonger activement dans le monde des données -omiques. Il propose:
- des exposées par des spécialistes actifs dans le domaine,
- des mini-projets de traitement de données à réaliser chaque semaine,
- un projet final sur des données proposées par les différents intervenants du cours ou de data repositories.
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
Dans le cadre de ce cours, les étudiant·es sont évalué·es de deux manières :
- l’évaluation continue certificative incluant:
- des travaux obligatoires à remettre en cours de quadrimestre selon un calendrier fixé en début de quadrimestre (40% de la note finale)
- et un projet final à présenter oralement lors du dernier cours (40% de la note finale)
- un examen oral à livre ouvert (20% de la note finale)
Ressources
en ligne
en ligne
Site Moodle: https://moodle.uclouvain.be/course/view.php?id=2964
Faculté ou entité
en charge
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en science des données, orientation statistique
Master [120] en statistique, orientation biostatistiques
Master [120] en statistique, orientation générale
Master [120] : bioingénieur en chimie et bioindustries
Certificat d'université : Statistique et science des données (15/30 crédits)
Master [120] : bioingénieur en sciences agronomiques