Principes de statistiques et analyse des données biologiques

lbio1283  2020-2021  Louvain-la-Neuve

Principes de statistiques et analyse des données biologiques
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
4 crédits
30.0 h + 40.0 h
Q2
Enseignants
Langue
d'enseignement
Français
Préalables
LBIO1282

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Thèmes abordés
Ce cours pose les bases des probabilités et statistiques nécessaires à l’analyse de données biologiques. Les thèmes abordés sont : variables aléatoires (nature, distributions et calcul de probabilités), principes de l’inférence statistique (échantillonnage, hypothèse nulle et alternative, test d’hypothèse et intervalle de confiance), et méthodes d’inférence statistique de base (test de t, analyse de la variance, corrélation et régression, Xhi² ).
Les travaux pratiques permettront une mise en pratique au moyen du logiciel R.
Au terme de ce cours, les étudiants seront capables de concevoir le plan expérimental et d’échantillonnage pour répondre à une question biologique simple, d’analyser les données, et d’interpréter les résultats en ayant conscience des limitations éventuelles à l’inférence posées par les données et/ou le respect des conditions de l’analyse statistique.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Au terme de cet apprentissage, l'étudiant sera capable de :
en ce qui concerne les statistiques
-Calculer et interpréter les indicateurs les plus courants de la statistique descriptive (moyenne, écart-type, quantiles, ..)
-Réaliser et interpréter un graphique de fréquences observées / cumulées, une boîte à moustache (boxplot) ; interpréter un graphe quantile-quantile (QQ-plot)
-Choisir la distribution théorique adéquate permettant de modéliser une variable aléatoire
-Démontrer sa compréhension du concept de variable aléatoire et des principes de l'inférence statistique (population vs échantillon, estimateur, test d'hypothèse, p-valeur... )
-Formuler un test d'hypothèse en termes d'hypothèse nulle et d'hypothèse alternative, réaliser un test d'hypothèse et en tirer des conclusions en français
-Appliquer une méthode d'inférence de base (test de t, analyse de la variance, corrélation et régression, Xhi² )
en ce qui concerne l'emploi du logiciel R
A partir d'une liste détaillée de fonctions et/ou d'exemples résolus :
- Calculer et interpréter les indicateurs les plus courants de la statistique descriptive (moyenne, écart-type, quantiles, ...)
- Réaliser et interpréter une boîte à moustache (boxplot), un graphe quantile-quantile (QQ-plot)
- Calculer et interpréter corrélation et régression
- Réaliser un test de t, une analyse de la variance, un test Xhi² et en interpréter les résultats
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
A travers ce cours, l'étudiant acquiert les notions et principes de base des probablilités et de l'inférence statistiques nécessaires à la démarche scientifique. En fin d'apprentissage, il est à même de déterminer les caractéristiques importantes d'un plan expérimental, de choisir et réaliser l'analyse statistique appropriée à l'analyse des données, et d'interpréter les résultats et les éventuelles limitations aux conclusions à en tirer.
Le cours commence par les bases de la théorie des probabilités. Il détaille ensuite les principes de l'inférence statistique (population vs échantillon; variables et distributions; sources de variations dans les données; test d'hypothèse, p-valeur et erreur de type I et II; intervalle de confiance...). Les principaux types d'analyse statistiques de base sont détaillés et illustrés: test de t, ANOVA (1, 2 et 3), corrélation et régression linéaire simple, données de comptage (X²). Les principes des tests par permutation sont aussi abordés.
Le cours est complété par des travaux pratiques sur ordinateur au moyen du logiciel R qui permettent à l'étudiant de réaliser en pratique toutes les analyses statistiques abordées.
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Cours en auditoire et travaux pratiques en salle informatique. L'étudiant est encouragé à l'interactivité pour toutes ces activités.
Dans le cas où les règles sanitaires n'autorisent pas un enseignement entièrement en présentiel, le cours sera retransmis en direct via Microsoft Teams, soit pour tous les étudiants, soit pour une partie (pendant que l'autre partie suis le cours en présentiel). Le cours sera aussi interactif que possible avec la possibilité pour chaque étudiant de poser ses questions en direct.
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Examen écrit à livre ouvert consituté de questions à choix mutliples, de questions ouvertes et de résolution pratique d'exercices avec le logiciel R sur ordinateur. L'examen est réalisé sur Moodle, en salle informatique sur campus, sauf si les règles sanitaires imposent un passage de l'examen en distanciel.
Les notes finales devant être arrondies à l'unité, cette arrondi se fait vers l'unité supérieure si l'étudiant à obtenu au moins 50% des points possibles pour la partie "questions de compréhension théorique" et 50% des points possibles pour la partie "résolution pratique d'exercices", et vers l'unité inférieure si ce n'est pas le cas.
Autres infos
Une connaissance de base du logiciel R est nécessaire: l'étudiant est supposé être capable de créer et modifier des jeux de données en R de manière autonome. Le cours LBIO1282 vise spécifiquement à donner à l'étudiant ces connaissances; s'il ne l'a pas suivi au préalable, l'étudiant doit se former de manière autonome à ces compétences, p.ex. au moyen des nombreuses ressources disponibles en ligne gratuitement.
Ressources
en ligne
Les diapositives du cours et le matériel en support aux travaux pratiques sont disponibles sur Moodle.
Des vidéos d'introduction aux travaux pratiques sont également disponibles.
Si les règles santaires imposent que certains cours soient données en direct avec microsoft Teams, ceux-ci seront enregistrés et mis à disposition des étudiants. 
Support de cours
  • Visuels du cours disponibles sur Moodle
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en sciences biologiques

Mineure en biologie

Bachelier en sciences géographiques, orientation générale