Data analysis and modeling of biological systems

lboe2112  2024-2025  Louvain-la-Neuve

Data analysis and modeling of biological systems
5.00 crédits
24.0 h + 36.0 h
Q1
Langue
d'enseignement
Anglais
Préalables
Le cours repose sur des bases supposées acquises par les étudiants plus tôt dans leurs études :
calcul des probabilités, bases de l'inférence statistique, principes et pratique des méthodes classiques pour des données continues (régression, analyse de la variance) et discrètes (tests d'ajustement, tables de contingence), utilisation d'un logiciel pour la mise en oeuvre de ces analyses dans des situations expérimentales classiques.
Thèmes abordés
Tenant compte des besoins le plus fréquemment rencontrés et du volume horaire disponible, le cahier des
charges prévoit un module de modélisation linéaire et un module d'analyse multidimensionnelle.
Vu son insertion dans le programme BOE, le cours puisera ses exemples surtout dans le domaine écologique.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 L'objectif est qu'au terme de ce cours, les étudiants :

- Aient intégré la nécessité d'une démarche de planification préalable à toute expérimentation.
- Aient mis en pratique, dans le cadre d'une expérience scientifique personnelle, les principaux principes
de cette démarche.
- Soient capables de rechercher, choisir et appliquer en connaissance de cause les méthodes les mieux
adaptées pour la modélisation et l'analyse des données biologiques dans leur domaine.
- Aient acquis une autonomie de base pour la mise sur pied d'une expérience scientifique, la gestion des
données qu'elle engendre, leur analyse à l'aide d'un logiciel statistique et l'interprétation critique des
résultats.
- Aient montré leur capacité à rédiger le rapport d'une expérience scientifique (à réaliser seul ou en
groupes de deux ou trois), reprenant l'ensemble des étapes ci-dessus.
 
Contenu
Module 1 : Modélisation statistique linéaire
Introduction théorique aux modèles mixtes et généralisés (6h) ; Séances d’exercices sur R (14h) ; Deux études de cas sur des modèles mixtes et généralisés (4h+2h)

Module 2 : Analyse de données multivariées
Ce module détaille comment visualiser et vérifier des données multivariées, comment synthétiser et combiner un ensemble de variables continues en un nombre inférieur de variables grâce à l'ACP (Analyse en Composantes Principales), comment réaliser l'équivalent de l'ACP pour des données catégorielles (AFC, Analyse Factorielle des Correspondances), et comment démêler les liens entre deux ensembles de variables continues (Analyse de Corrélation Canonique). La philosophie d'enseignement insiste sur le fait que les statistiques sont des outils et que les compétences clés que l'étudiant doit acquérir sont l'expertise pour choisir le bon outil pour le travail, comment le paramétrer et interpréter ses résultats de manière critique. Des exemples réels issus de l'écologie seront utilisés pour illustrer des cas propres mais aussi plus difficiles, plus proches de la vie réelle.
Méthodes d'enseignement
Cours magistraux, séminaires et séances d'exercices en salle informatique. L'étudiant est encouragé à l'interactivité pour toutes ces activités.
Exercices : apprendre à résoudre un problème statistique. Trouver l'analyse appropriée face à un problème, vérifier les conditions d'application relatives à l'utilisation de cette analyse, réaliser le test statistique sur le logiciel R, interpréter les résultats obtenus et les illustrer.
Modes d'évaluation
des acquis des étudiants
Les deux modules seront évalués séparément, chaque module contribuant à hauteur de 10/20 à la note finale. La note finale devant être un nombre entier, la somme des deux notes sera arrondie à la hausse si les deux modules sont réussis (au moins 5/10) et à la baisse si ce n'est pas le cas.
Module 1 : Modélisation statistique linéaire
Examen à livre ouvert, comprenant deux exercices sur LMM et GLM(M) sur R (basés sur les TPs et le premier séminaire) et une étude de cas (basée sur le deuxième séminaire).
Module 2 : Analyse de données multivariées
Examen écrit à livre ouvert composé de questions à choix multiples, de questions ouvertes et de résolution pratique d'exercices avec le logiciel R sur ordinateur. L'examen se déroule sur Moodle, dans une salle informatique du campus, sauf si les règles sanitaires imposent de passer l'examen à distance.
Autres infos
Une connaissance de base du logiciel R est requise : l'étudiant doit être capable de créer et de modifier des ensembles de données R de manière autonome et d'effectuer des procédures de gestion de données et d'analyse statistique de base. Si ces connaissances ne sont pas acquises, l'étudiant doit être formé de manière autonome à ces compétences, par exemple au moyen des nombreuses ressources disponibles gratuitement en ligne.
Ressources
en ligne
Toutes les ressources sont disponibles sur le site de Moodle : visuels des cours et des séances pratiques, jeux de données et scripts R, liens vers des ressources complémentaires et des ouvrages de soutien.
Support de cours
  • Les visuels du cours et de support aux travaux pratiques / Course visuals and materials supporting the practical work
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en biologie des organismes et écologie

Master [60] en sciences biologiques