November 04, 2022
16:00
Louvain-la-Neuve
ISBA - C115 (1st Floor)
WORKSHOP by Bernadette Govaerts (UCLouvain)
"Combinaison de méthodes de tests multiples et multivariées pour la modélisation de données -omiques issues d’un plan expérimental"
Résumé:
De nombreuses technologies modernes sont utilisées pour analyser des échantillons issus de plans expérimentaux en particulier dans les domaines médical, biologique, chimique ou agronomique. Elles génèrent la plupart du temps des données hautement multivariées comme des spectres ou des images, où le nombre de variables (réponses) est beaucoup plus grand que le nombre d'unités expérimentales.
C’est en particulier le cas des sciences -omiques qui visent à comprendre les systèmes biologiques en s'intéressant aux gènes (génomique), aux ARN messagers (transcriptomique), aux protéines (protéomique) et aux métabolites (métabolomique). L'acquisition des données associées peut être réalisée par différentes technologies : Spectroscopie par Résonance Magnétique Nucléaire (RMN), Chromatographie Liquide combinée à la Spectrométrie de Masse (LC-MS), RNAseq (séquençage d'ARN), microarrays ou qPCR (réaction en chaîne par polymérase en temps réel). Étant donné que les expériences dans ces domaines reposent souvent sur des plans d'expérience multi-factoriels, des méthodes adaptées sont nécessaires pour interpréter ces données.
Deux approches complémentaires sont couramment utilisées dans ce contexte. La première, souvent référencée comme «Differential gene expression analysis » en transcriptomique, consiste à rechercher quelles réponses (ex : expressions de gènes) sont affectées par les facteurs du plan d’expérience via une modélisation linéaire suivie de tests multiples assurant de limiter le taux de faux positifs parmi les nombreux tests réalisés.
Cette première approche a comme défaut de générer une grande quantité d’information difficile à interpréter et il est donc idéal de la combiner avec des outils qui permettent de visualiser les résultats globalement et aussi analyser/visualiser les corrélations entre les réponses. Quand le plan d’expérience est simple, la PCA ou la PLS-DA peuvent répondre à cet objectif mais ne sont pas adaptées quand l’expérience implique deux facteurs ou plus. C’est dans ce contexte que les méthodes ASCA et APCA ont été développées. Elles combinent la modélisation linéaire et la visualisation de effets estimés par des méthodes de réduction de dimension et sont un sujet de recherche encore en plein essor actuellement. L’UCLouvain a proposé plusieurs extensions de ces méthodes et les a implémentées dans un package R.
L’objectif de cette présentation sera de présenter le contexte sur plusieurs applications de données o-miques puis décrire brièvement les deux méthodologies citées et montrer leur complémentarité sur les applications.
TEAMS LINK here : TEAMS