Modélisation et exploration des données multivariées - Biométrie

lbira2110a  2021-2022  Louvain-la-Neuve

Modélisation et exploration des données multivariées - Biométrie
3.00 crédits
30.0 h + 15.0 h
Q1
Enseignants
Draye Xavier; Gaspart Frédéric; Govaerts Bernadette;
Langue
d'enseignement
Français
Préalables
Eléments de probabilité et de statistique (typiquement les cours BIR 1203 et BIR 1204)
Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Thèmes abordés
Méthodes quantitatives d'analyse des données dans le domaine de la bioingénierie. Le cours aborde les méthodes d’analyse des données issues d’expériences : analyse de la variance à un ou plusieurs critères de classification croisés ou hiérarchisés, modèles linéaires généralisés (facteurs catégoriels et continus), modèles pour données catégorielles, analyse en composantes principales.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 a. Contribution de l'activité au référentiel AA (AA du programme)
A la fin de cette unité d’enseignement, l’étudiant est capable de :
  • Maîtriser des savoirs-faire procéduraux dans la réalisation d'expériences (M1.3)
  • Connaître et comprendre un socle de savoirs approfondis et d'outils en Sciences de l'ingénieur (M2.1)
  • Maîtriser de manière opérationnelledes outils spécialisés en Sciences de l'ingénieur (M2.3)
  • Maîtriser et mobiliser des outils d'analyse statistiques de données scientifiques dans le cadre d'une problématique scientifique complexe (M3.5)
  • Faire preuve d'une capacité d'abstraction conceptuelle et de formalisation dans l'analyse  et la résolution de problèmes (M4.4)
  • Communiquer des résultats et conclusions et appuyer un message de manière pertinente à l'aide de tableaux, graphiques et schémas scientifiques (M6.5) 
b. Formulation spécifique pour cette activité des AA du programme (maximum 10)
A la fin de cette activité, l'étudiant est capable, face une situation expérimentale donnée et avec le logiciel R :        
  • de choisir et écrire l'équation du modèle statistique adapté à l'expérience réalisée et aux questions posées
  • d'estimer le modèle avec éventuellement différentes méthodes d'estimation
  • de valider la qualité du modèle estimé, déterminer les termes/paramètres significatifs et d'adapter éventuellement le modèle
  • d'interpréter les effets des facteurs sur la réponse via des tests simples ou de contrastes et des graphiques afin de répondre aux questions de l'étude      
  • d'utiliser le modèle estimé pour réaliser des prédictions 
  • dans le cas de données catégorielles, d'écrire les hypothèses à tester, d'appliquer le test et d'interpréter les résultats      
  • d'expliquer dans ses mots les importants concepts/méthodes vus au cours : différents types de modèles linéaires , modèles fixes, aléatoires ou mixtes, hypothèses sous jacentes aux modèles/méthodes , méthodes d'estimation des moindres carrés, maximum de vraisemblance, maximum de vraisemblance restreint, méthodes de construction de tests (test t univarié, test F pour modèles emboités, espérances de carrés moyens, rapports de vraisemblance'),      
  • d'écrire du code SAS pour estimer un modèle donné
  • d'interpréter précisément les résultats d'une sortie SAS ou JMP en étant capable de dire pour CHAQUE nombre d'un tableau de résultats à quel concept sous'jacent il correspond en sachant expliquer ce concept, dire comment le nombre a été calculé et comment l'interpréter dans le contexte.
 
Contenu
Introduction
Modèles pour une réponse quantitative et un facteur fixe
-        Modèle linéaire à un facteur quantitatif
-        Modèle polynomial ou non linéaire
-        Analyse de la variance à un facteur fixe
Modèles linéaires pour une réponse quantitative et deux facteurs fixes
-        Analyse de la variance à deux facteurs fixes
-        Régression linéaire multiple
-        Analyse de covariance et modèle linéaire général
Modèles pour données catégorielles
-        Tables de contingences
-        Régression logistique
-        Modèles linéaires généralisés 
Méthodes multivariées
-        Analyse en composantes principales
-        Clustering hiérarchique et k-means
Méthodes d'enseignement
Cours en auditoire et en distantiel
Séances de TP
Apprentissage du logiciel R avec Data Camp
Modes d'évaluation
des acquis des étudiants
Examen écrit
Test R en cours de quadrimestre (S9 en 2020-21)
Evaluation continue (préparation de TP, quizz)
Autres infos
Ce cours peut être donné en anglais
Ressources
en ligne
Toutes les ressources sont en ligne sur Moodle
- Transparents de théorie et d'exemples liés au cours 
- Enoncés d'exercices 
- Formulaire
- Poscasts des cours enregistrés
Faculté ou entité
en charge
AGRO


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en sciences mathématiques

Approfondissement en statistique et sciences des données

Mineure en statistique, sciences actuarielles et science des données

Certificat d'université : Statistique et sciences des données (15/30 crédits)