Principes de statistiques et analyse des données biologiques

lbio1283  2021-2022  Louvain-la-Neuve

Principes de statistiques et analyse des données biologiques
4.00 crédits
30.0 h + 40.0 h
Q2
Enseignants
Schtickzelle Nicolas;
Langue
d'enseignement
Français
Préalables
LBIO1282

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Thèmes abordés
Ce cours pose les bases des probabilités et statistiques nécessaires à l’analyse de données biologiques. Les thèmes abordés sont : variables aléatoires (nature, distributions et calcul de probabilités), principes de l’inférence statistique (échantillonnage, hypothèse nulle et alternative, test d’hypothèse et intervalle de confiance), et méthodes d’inférence statistique de base (test de t, analyse de la variance, corrélation et régression, Xhi² ).
Les travaux pratiques permettront une mise en pratique au moyen du logiciel R.
Au terme de ce cours, les étudiants seront capables de concevoir le plan expérimental et d’échantillonnage pour répondre à une question biologique simple, d’analyser les données, et d’interpréter les résultats en ayant conscience des limitations éventuelles à l’inférence posées par les données et/ou le respect des conditions de l’analyse statistique.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Au terme de cet apprentissage, l'étudiant sera capable de :
en ce qui concerne les statistiques
-Calculer et interpréter les indicateurs les plus courants de la statistique descriptive (moyenne, écart-type, quantiles, ..)
-Réaliser et interpréter un graphique de fréquences observées / cumulées, une boîte à moustache (boxplot) ; interpréter un graphe quantile-quantile (QQ-plot)
-Choisir la distribution théorique adéquate permettant de modéliser une variable aléatoire
-Démontrer sa compréhension du concept de variable aléatoire et des principes de l'inférence statistique (population vs échantillon, estimateur, test d'hypothèse, p-valeur... )
-Formuler un test d'hypothèse en termes d'hypothèse nulle et d'hypothèse alternative, réaliser un test d'hypothèse et en tirer des conclusions en français
-Appliquer une méthode d'inférence de base (test de t, analyse de la variance, corrélation et régression, Xhi² )
en ce qui concerne l'emploi du logiciel R
A partir d'une liste détaillée de fonctions et/ou d'exemples résolus :
- Calculer et interpréter les indicateurs les plus courants de la statistique descriptive (moyenne, écart-type, quantiles, ...)
- Réaliser et interpréter une boîte à moustache (boxplot), un graphe quantile-quantile (QQ-plot)
- Calculer et interpréter corrélation et régression
- Réaliser un test de t, une analyse de la variance, un test Xhi² et en interpréter les résultats
 
Contenu
A travers ce cours, l'étudiant acquiert les notions et principes de base des probablilités et de l'inférence statistiques nécessaires à la démarche scientifique. En fin d'apprentissage, il est à même de déterminer les caractéristiques importantes d'un plan expérimental, de choisir et réaliser l'analyse statistique appropriée à l'analyse des données, et d'interpréter les résultats et les éventuelles limitations aux conclusions à en tirer.
Le cours commence par les bases de la théorie des probabilités. Il détaille ensuite les principes de l'inférence statistique (population vs échantillon; variables et distributions; sources de variations dans les données; test d'hypothèse, p-valeur et erreur de type I et II; intervalle de confiance...). Les principaux types d'analyse statistiques de base sont détaillés et illustrés: test de t, ANOVA (1, 2 et 3), corrélation et régression linéaire simple, données de comptage (X²). Les principes des tests par permutation sont aussi abordés.
Le cours est complété par des travaux pratiques sur ordinateur au moyen du logiciel R qui permettent à l'étudiant de réaliser en pratique toutes les analyses statistiques abordées.
Méthodes d'enseignement
Cours en auditoire et travaux pratiques en salle informatique. L'étudiant est encouragé à l'interactivité pour toutes ces activités.
Dans le cas où les règles sanitaires n'autorisent pas un enseignement entièrement en présentiel, le cours sera retransmis en direct via Microsoft Teams, soit pour tous les étudiants, soit pour une partie (pendant que l'autre partie suit le cours en présentiel). Le cours sera aussi interactif que possible avec la possibilité pour chaque étudiant de poser ses questions en direct.
Modes d'évaluation
des acquis des étudiants
Examen écrit à livre ouvert constiué de questions à choix mutliples, de questions ouvertes et de résolution pratique d'exercices avec le logiciel R sur ordinateur. L'examen est réalisé sur Moodle, en salle informatique sur campus, sauf si les règles sanitaires imposent un passage de l'examen en distanciel.
Les notes finales devant être arrondies à l'unité, cet arrondi se fait vers l'unité supérieure si l'étudiant à obtenu au moins 50% des points possibles pour la partie "questions de compréhension théorique" et 50% des points possibles pour la partie "résolution pratique d'exercices", et vers l'unité inférieure si ce n'est pas le cas.
Autres infos
Une connaissance de base du logiciel R est nécessaire: l'étudiant est supposé être capable de créer et modifier des jeux de données en R de manière autonome. Le cours LBIO1282 vise spécifiquement à donner à l'étudiant ces connaissances; s'il ne l'a pas suivi au préalable, l'étudiant doit se former de manière autonome à ces compétences, p.ex. au moyen des nombreuses ressources disponibles en ligne gratuitement.
Ressources
en ligne
Les visuels du cours et le matériel en support aux travaux pratiques sont disponibles sur Moodle.
Des vidéos d'introduction aux travaux pratiques sont également disponibles.
Si les règles santaires imposent que certains cours soient donnés en direct avec microsoft Teams, ceux-ci seront enregistrés et mis à disposition des étudiants. 
Support de cours
  • Visuels du cours disponibles sur Moodle
Faculté ou entité
en charge
BIOL


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Mineure en biologie

Bachelier en sciences biologiques

Bachelier en sciences géographiques, orientation générale