Statistique et data sciences avec R: Programmation avancée

lstat2030  2021-2022  Louvain-la-Neuve

Statistique et data sciences avec R: Programmation avancée
4 crédits
15.0 h + 15.0 h
Q2
Enseignants
Langue
d'enseignement
Français
Préalables
L'étudiant devrait avoir suivi un cours sur les bases de R/Rstudio (Data.frame, Factor, boucles, indexation, fonctions et scripts, répertoire de travail ') ainsi qu'une formation en statistique méthodologique, comprenant un cours d'introduction en probabilité (distributions classiques, lois des grands nombres, théorème central limite ') et statistique (tests et intervalles de confiances, maximum de vraisemblance, régression (non-)linéaire '). De préférence, l'étudiant aura également suivi un cours sur l'analyse multivariée.
Thèmes abordés
Ce cours propose une formation intermédiaire à R/Rstudio et aux techniques de calcul statistique les plus fréquemment utilisées en pratique. Il s'adresse aux étudiants qui ont déjà acquis les bases du calcul statistique et manipulation de données en R et souhaites développer leurs compétences dans ce domaine. Le cours s'articule autour de deux axes: 1- développer des compétences de programmation R plus avancées et 2- apprendre des méthodes statistiques modernes qui nécessitent des calculs intensifs. Ce cours présentera ces concepts de manière pratique en évitant, le plus possible, les développements techniques et en utilisant des ensembles de données du monde réel et des problèmes statistiques courants. À la fin du cours, l'étudiant devrait être capable de mettre en 'uvre ces compétences de programmation en R pour effectuer des simulations et résoudre numériquement des problèmes d'inférence ou d'optimisation dont il est difficile ou impossible de trouver une solution sous forme fermée. L'étudiant devrait aussi être capable d'écrire un rapport automatisé et dynamique en utilisant R Markdown, de diffuser ces analyses et de partager son code R sous forme d'un Package.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», , cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.3, 2.2, 2.5, 3.3, 4.3
  • De manière secondaire les AA suivants: 3.2, 3.4, 3.5
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 2.2, 2.5, 3.3, 4.4, 5.3
  • De manière secondaire les AA suivants : 3.2, 3.4, 4.1, 4.2
 
Contenu
R – Avancé
  • Visualisation avec ggplot
  • Rmarkdown
  • git/github avec Rstudio
  • Débogage (Debugging), Vectorisation et calcul parallèle
  • Développement d’un package R sous Windows
  • Introduction à Shiny
Calculs Statistique
  • Monte-Carlo, MCMC et applications
  • Évaluation des méthodes statistique par simulation
  • Optimisation numérique
  • Inférence via calcul intensif (Permutation et Bootstrap)
Méthodes d'enseignement
Le cours sera constitué - d'exposés qui présenteront la matière sur base d'exemples, - de séances d'exercices visant à mettre systématiquement en pratique les différentes notions vues au cours sur des cas bien ciblés, - d'études de cas (projets) qui donneront l'occasion à l'étudiant d'appliquer les outils de programmation et d'analyse statistique. L'approche pédagogique utilisée privilégiera l'apprentissage actif des étudiants et tentera de respecter les orientations pédagogiques proposées par la Faculté.
Modes d'évaluation
des acquis des étudiants
  • Pendant les TPs : Un ou deux devoirs sous forme de mini projets (études de cas) à résoudre en groupe de 2 étudiants à l’aide de R.
  • Pendant la session des examens : Examen écrit assisté par ordinateur
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en statistique, orientation générale

Master [120] en sciences mathématiques

Master [120] en statistique, orientation biostatistiques

Master [120] en sciences actuarielles

Mineure en statistique, sciences actuarielles et science des données

Master de spécialisation en méthodes quantitatives en sciences sociales

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] en science des données, orientation statistique