Logiciels et programmation statistique de base

lstat2020  2020-2021  Louvain-la-Neuve

Logiciels et programmation statistique de base
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
4 crédits
15.0 h + 15.0 h
Q1
Enseignants
Langue
d'enseignement
Français
Préalables
Concepts mathématiques: calcul matriciel (notion de matrice, opérations de bases sur des matrices, déterminant, valeur propre, vecteur propre),dérivée et intégrale, dérivées partielles, équation d'une droite.
Formation de base en probabilité et statistique : statistiques descriptives (dont mesures de localisation  mesures de dispersion, graphiques), distributions statistiques, inférence (principe du test d'hypothèse, hypothèse H0 et H1, statistique de test, p-valeur  ainsi que leur interprétation), régression linéaire simple et multiple, analyse de la variance à un critère
Capacité d'utiliser couramment un ordinateur personnel : manipulation de fichiers, connaissance (élémentaire) de l'utilisation de Windows, Word, Excel, Internet Explorer, ainsi que de la plate-forme Moodle.
Thèmes abordés
Les thèmes abordés dans les cours et exercices sont les suivants : - Etapes d'une analyse statistique de données sur ordinateur. - Classes de logiciels de statistique. - Graphisme en statistique : les graphiques utiles et leur mise en oeuvre efficace. - Utilisation de logiciels statistiques à menus pour la réalisation d'analyses statistiques de base. - Nettoyage de données. - Programmation avec le langage R. - Programmation en SAS.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 A. Eu égard au référentiel AA du programme de master en statistique, orientation générale, cette activité contribue au développement et à l'acquisition des AA suivants:
  • de manière prioritaire : 1.3, 2.2, 2.5, 3.2, 3.3, 3.4, 4.1, 4.2, 4.4, 5.2, 5.3, 5.5
  • de manière secondaire : 2.3
Eu égard au référentiel AA du programme de master en statistique, orientation biostatistique, cette activité contribue au développement et à l'acquisition des AA suivants:
  • de manière prioritaire : 1.3, 2.2, 2.5, 3.2, 3.3, 3.4, 3.5, 4.1, 4.2, 5.2, 5.4, 5.6
  • de manière secondaire : 2.3
B. Au terme du cours, les étudiants auront acquis une vue critique des différentes classes de logiciels de statistique disponibles sur le marché et des connaissances en graphisme statistique. Ils seront aussi capables de réaliser des analyses statistiques de base sur ordinateur à l'aide de divers logiciels (SAS, R, Excel, SPSS, JMP) et de programmer des algorithmes et manipuler des fichiers de données complexes avec des logiciels plus avancés (SAS et R).
 
Contenu
Cours magistral : Etapes d'une analyse statistique de données sur ordinateur. Introduction au différentes classes de logiciels de statistique.  Présentation graphique de données.  Introduction aux logiciels statistiques, Initiation à l'utilisation de la salle informatique. Etudes de cas d'analyse d'ensemble de données par des méthodes statistiques de base. Génération de nombres aléatoires. Problème numériques rencontrés en régression. Introduction à R et SAS. Communication entre les différents logiciels et langages (R, SAS, Python, etc...).

Exercices : Exercices de programmation en SAS et R. Etudes de cas avec les logiciels SPSS ou JMP.
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

 Le cours est composé d'exposés magistraux étoffés de démonstrations de logiciels statistiques et de séances d'exercices d'utilisation des logiciels qui visent à donner une autonomie maximum à l'étudiant : chaque étudiant travaille à son rythme sur base de documents évolutifs.
Les modalités prévues évolueront en fonction de la situation sanitaire.
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Deux travaux OBLIGATOIRES de programmation en SAS et R.
Examen sur ordinateur (en salle si la situation sanitaire le permet). Résolution d'études de cas de statistique de base avec le logiciel SAS Enterprise Guide et SPSS (ou JMP), programmation SAS et R. 
Attention, les travaux obligatoires sont à réaliser pendant le premier quadrimestre suivant un calendrier qui vous sera communiqué au début de cours. En cas de non remise d'un travail, l'étudiant aura 0 lors de son premier passage de l'examen. Cependant, après autorisation du professeur, il pourra éventuellement passer une question supplémentaire pour rattraper sa cote à partir de son deuxième passage de l'examen. Sa demande de repasser la cote des travaux devra être formulée AVANT le début de la session d'examen et ne sera examinée que si le travail n'a pas été rendu ou bien est raté (moins de 50%).
Autres infos
COTATION
Les étudiants inscrits aux 2 parties du cours doivent réussir les 2 parties pour réussir le coursSi la cote d’une des 2 parties est inférieure à 50%, c’est cette cote qui sera reprise comme cote totale pour le cours.
Les points attribués aux projets dépendent de votre réussite des questions de programmation à l’examen:
  • Cote du projet sur 1,25 si votre cote de projet > 2*cote des questions de programmation à l’examen
  • Cote du projet sur 2,5 si votre cote de projet ≤ 2*cote des questions de programmation à l’examen
Faculté ou entité
en charge
Force majeure
Modes d'évaluation
des acquis des étudiants
La crise sanitaire implique des incertitudes quant aux modalités d’évaluation en particulier pour la session de janvier. Deux options sont envisagées selon la sévérité des contraintes liées à la crise sanitaire.
Un plan A en présentiel :
  • Examen écrit
Un plan B en distanciel :
  • Examen écrit sur Gradescope


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] en sciences mathématiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Mineure en statistique, sciences actuarielles et science des données

Master [120] : ingénieur civil en mathématiques appliquées

Master [120] : bioingénieur en sciences agronomiques

Master [120] : bioingénieur en gestion des forêts et des espaces naturels

Master [120] : bioingénieur en sciences et technologies de l'environnement

Master [120] : bioingénieur en chimie et bioindustries

Approfondissement en statistique et sciences des données

Master [120] en statistique, orientation générale

Master [120] en statistique, orientation biostatistiques

Master [120] : ingénieur civil biomédical