Data analysis and modeling of biological systems

lboe2112  2023-2024  Louvain-la-Neuve

Data analysis and modeling of biological systems
5.00 crédits
24.0 h + 36.0 h
Q1
Enseignants
Langue
d'enseignement
Anglais
Préalables
Le cours repose sur des bases supposées acquises par les étudiants plus tôt dans leurs études :
calcul des probabilités, bases de l'inférence statistique, principes et pratique des méthodes classiques pour des données continues (régression, analyse de la variance) et discrètes (tests d'ajustement, tables de contingence), utilisation d'un logiciel pour la mise en oeuvre de ces analyses dans des situations expérimentales classiques.
Thèmes abordés
Tenant compte des besoins le plus fréquemment rencontrés et du volume horaire disponible, le cahier des
charges prévoit un module de modélisation linéaire et un module d'analyse multidimensionnelle.
Vu son insertion dans le programme BOE, le cours puisera ses exemples surtout dans le domaine écologique.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 L'objectif est qu'au terme de ce cours, les étudiants :

- Aient intégré la nécessité d'une démarche de planification préalable à toute expérimentation.
- Aient mis en pratique, dans le cadre d'une expérience scientifique personnelle, les principaux principes
de cette démarche.
- Soient capables de rechercher, choisir et appliquer en connaissance de cause les méthodes les mieux
adaptées pour la modélisation et l'analyse des données biologiques dans leur domaine.
- Aient acquis une autonomie de base pour la mise sur pied d'une expérience scientifique, la gestion des
données qu'elle engendre, leur analyse à l'aide d'un logiciel statistique et l'interprétation critique des
résultats.
- Aient montré leur capacité à rédiger le rapport d'une expérience scientifique (à réaliser seul ou en
groupes de deux ou trois), reprenant l'ensemble des étapes ci-dessus.
 
Contenu
Module 1 : Modélisation statistique linéaire
Introduction théorique aux modèles linéaires mixtes et généralisés (6h) ; deux études de cas sur des modèles mixtes et généralisés (2x3h). À la fin de chaque cours magistral, l'enseignant présentera un article scientifique qui ressemble à l'étude de cas qui vient d'être présentée. L'enseignant demande aux élèves d'interpréter les résultats statistiques de cet article (par exemple, qu'est-ce qui ne va pas avec les techniques statistiques ? Qu'est-ce qui aurait pu être mieux fait ? Que signifient/impliquent les résultats ?). Les étudiants écriront leurs réponses dans leur rapport de groupe, qui sert d'évaluation (voir « Évaluation »).

Module 2 : Exploration de données multivariées
Après un bref rappel sur l'algèbre linéaire et la géométrie euclidienne (vecteurs, matrices, distances, angles), les techniques d'ordination (canoniques) suivantes seront traitées : analyse en composantes principales, analyse des correspondances, analyse des redondances (aussi appelée analyse en composantes principales sur variables instrumentales) et analyse des correspondances canoniques. Les cours (12h) traiteront à la fois du contexte théorique et de l'implémentation pratique via un logiciel statistique moderne (R, librairie ade4).
Méthodes d'enseignement
Cours magistraux, séminaires et séances d’exercices dans une salle informatique. Auto-apprentissage.
Exercices : apprendre à résoudre un problème statistique. Trouver l’analyse adéquate face à un problème, vérifier les conditions d’application relatives à l’utilisation de cette analyse, réaliser le test statistique sur le logiciel R, interpréter les résultats obtenus et les illustrer.
Modes d'évaluation
des acquis des étudiants
Les deux modules seront évalués séparément, chaque module contribuant 10/20 à la note finale.
Module 1 (Modèlisation statistique linéaire) :
Un rapport de groupe sert comme évaluation :
  • Groupes de 4 étudiants (2 avec des connaissances plus solides et 2 avec des connaissances plus faibles en statistiques).
  • Les exercices pendant les séances d'exercices sont utilisés pour « former » les étudiants. Les solutions à ces problèmes ne devraient pas figurer dans les rapports.
  • Pour le rapport, les étudiants ont un nouveau problème à résoudre.
  • Dans le rapport, les étudiants doivent également répondre à une question sur l'interprétation d'une analyse dans un article publié.
Module 2 (Exploration de données multivariées) :
L'évaluation se compose de deux parties, chaque partie comptant pour 5/10 :
  • Un examen écrit (à cours ouvert) sur l'interprétation correcte des sorties numériques et graphiques d'analyses de données écologiques.
  • Un rapport de groupe sur des analyses de données, à réaliser par les étudiants eux-mêmes, couvrant à la fois la mise en œuvre des méthodes et l'interprétation des sorties.
Ressources
en ligne
Page Moodle UCLouvain
Code informatique du livre Zuur et al. (2007) conseillé : http://highstat.com/index.php/analysing-ecological-data
Site web auto-apprentissage: http://webapps.fundp.ac.be/umdb/biostats2017/
Bibliographie
  • Dias cours magistraux, syllabus TP, bases de données, codes informatiques. Site web auto-apprentissage.
  • Alain F. Zuur, Elena N. Iono, Graham M. Smith, Analysing Ecological Data, Springer Science, 2007 (non-obligatoire).
  • Pierre Legendre, Louis Legendre, Numerical Ecology, Elsevier, 2012 (non-obligatoire)
Support de cours
  • Dias cours magistraux et TP, syllabus TP, bases de données, codes informatiques. Site web auto-apprentissage.
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en biologie des organismes et écologie

Master [60] en sciences biologiques