Machine Learning : classification and evaluation

lingi2262  2020-2021  Louvain-la-Neuve

Machine Learning : classification and evaluation
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
6 crédits
30.0 h + 30.0 h
Q2
Enseignants
Langue
d'enseignement
Anglais
Thèmes abordés
  • Apprentissage par recherche, par biais inductif
  • Combinaisons de décisions
  • Minimisation d'une fonction de perte, descente de gradient
  • Evaluation des performances
  • Apprentissage par mémorisation de prototypes
  • Apprentissage probabiliste
  • Classification non supervisée
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • INFO1.1-3
  • INFO2.3-4
  • INFO5.3-5
  • INFO6.1, INFO6.4
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • SINF1.M4
  • SINF2.3-4
  • SINF5.3-5
  • SINF6.1, SINF6.4
Les étudiants ayant suivi avec fruit ce cours seront capables de
  • comprendre et appliquer des techniques standard pour construire des programmes informatiques qui s'améliorent automatiquement avec l'expérience, en particulier pour les problèmes de classification
  • évaluer la qualité d'un modèle appris pour une tâche donnée
  • évaluer les performances relatives de plusieurs algorithmes d'apprentissage
  • justifier de l'utilisation d'un algorithme d'apprentissage particulier en prennant en compte la nature des données, le problème d'apprentissage et une mesure de performance pertinente
  • utiliser, adapter et étendre des  logiciels d'apprentissage
Les étudiants auront développé des compétences méthodologiques et opérationnelles.  En particulier, ils auront développé leur capacité à :
  • exploiter la documentation technique pour faire un usage efficace d'un package préexistant,
  • communiquer des résultats de test sous forme synthétique en utilisant par exemple des graphiques.
 
Contenu
  • Apprentissage d'arbres de décision: ID3, C4.5, CART, Forêts aléatoires
  • Discriminants linéaires: perceptrons, descente de gradient et minimisation des moindres carrés
  • Hyperplans de marge maximale et séparateurs à vaste marge
  • Apprentissage profond
  • Probabilités et statistiques en apprentissage automatique
  • Évaluation des performances: tests d'hypothèses, comparaisons d'algorithmes d'apprentissage, analyse ROC
  • Classificateurs gaussiens, discriminants de Fisher
  • Apprentissage bayésien: maximum de vraisemblance, maximum a posteriori, classifieur optimal, classifieur bayésien naïf
  • Apprentissage par mémorisation de prototypes: k plus proches voisins, algorithme LVQ
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

  • Cours magistraux
  • Plusieurs projets incluant quelques questions théoriques et principalement des applications pratiques. 
Les cours magistraux sont donnés, par défaut, en présentiel. Selon le nombre effectif d'étudiant.e.s inscrit.e.s au cours et l'évolution de la situation sanitaire, un dispositif pour pouvoir suivre le cours à distance sera également mis en place (enseignement co-modal).
Les projets sont soumis en ligne et évalués sur la plateforme Inginious.
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Les projets valent pour 40 % de la note finale, 60 % pour l'examen final (à livre fermé).
Les projets ne peuvent pas être refaits en seconde session, les notes de projets sont donc déjà fixées à la fin du quadrimestre et reprises telles quelles dans la note finale en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur un ordinateur).
Ces règles d'évaluation sont sujettes à d'éventuelles mises à jour en fonction de la situation sanitaire. En particulier, le poids relatif des projets et de l'examen final pourrait être adapté.  De telles adaptations seraient alors notifiées aux étudiants via une annonce générale sur le site Moodle du cours.
Bibliographie
Des ouvrages complémentaires sont recommandés sur le site Moodle du cours.
Additional textbooks are recommended on the Moodle site for this course.
Support de cours
  • Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles depuis le site Moodle du cours.
  • Required teaching material include all documents (lecture slides, project assignments, complements, ...) available from the Moodle website for this course.
Faculté ou entité
en charge
Force majeure
Méthodes d'enseignement
Les cours magistraux se donnent en distanciel. Les travaux pratiques continuent à être en ligne sur le serveur Inginious.
Modes d'évaluation
des acquis des étudiants
L'évaluation est basée uniquement sur les projets (pas d'examen final) avec une pondération des projets revue comme suit pour constituer la note globale du cours :
  • projet 1 = 15%
  • projet 2 = 15 %
  • projet 3 = 10 %
  • projet 4 = 15 %
  • projet 5 = 45 %
En cas de seconde session, seul le projet 5 est réévalué et une nouvelle version de ce projet 5 a lieu. Les notes des autres projets sont fixées, après qu'un feedback a été soumis aux étudiants, et ne sont pas réévalués en seconde session. 


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] : ingénieur civil en informatique

Master [120] en sciences informatiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] : ingénieur civil électricien

Master [120] : ingénieur civil en mathématiques appliquées

Master [120] : ingénieur civil en science des données

Master [120] en science des données, orientation technologies de l'information

Master [120] en statistique, orientation générale

Master [120] en statistique, orientation biostatistiques

Master [120] : ingénieur civil biomédical

Master [60] en sciences informatiques