Machine Learning : classification and evaluation

linfo2262  2024-2025  Louvain-la-Neuve

Machine Learning : classification and evaluation
6.00 crédits
30.0 h + 30.0 h
Q2
Enseignants
Thèmes abordés
  • Apprentissage par recherche, par biais inductif
  • Combinaisons de décisions
  • Minimisation d'une fonction de perte, descente de gradient
  • Evaluation des performances
  • Apprentissage par mémorisation de prototypes
  • Apprentissage probabiliste
  • Classification non supervisée
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • INFO1.1-3
  • INFO2.3-4
  • INFO5.3-5
  • INFO6.1, INFO6.4
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • SINF1.M4
  • SINF2.3-4
  • SINF5.3-5
  • SINF6.1, SINF6.4
Les étudiants ayant suivi avec fruit ce cours seront capables de
  • comprendre et appliquer des techniques standard pour construire des programmes informatiques qui s'améliorent automatiquement avec l'expérience, en particulier pour les problèmes de classification
  • évaluer la qualité d'un modèle appris pour une tâche donnée
  • évaluer les performances relatives de plusieurs algorithmes d'apprentissage
  • justifier de l'utilisation d'un algorithme d'apprentissage particulier en prennant en compte la nature des données, le problème d'apprentissage et une mesure de performance pertinente
  • utiliser, adapter et étendre des  logiciels d'apprentissage
Les étudiants auront développé des compétences méthodologiques et opérationnelles.  En particulier, ils auront développé leur capacité à :
  • exploiter la documentation technique pour faire un usage efficace d'un package préexistant,
  • communiquer des résultats de test sous forme synthétique en utilisant par exemple des graphiques.
 
Contenu
  • Apprentissage d'arbres de décision: ID3, C4.5, CART, Forêts aléatoires
  • Discriminants linéaires: perceptrons, descente de gradient et minimisation des moindres carrés
  • Hyperplans de marge maximale et séparateurs à vaste marge
  • Apprentissage profond
  • Probabilités et statistiques en apprentissage automatique
  • Évaluation des performances: tests d'hypothèses, comparaisons d'algorithmes d'apprentissage, analyse ROC
  • Classificateurs gaussiens, discriminants de Fisher
  • Apprentissage bayésien: maximum de vraisemblance, maximum a posteriori, classifieur optimal, classifieur bayésien naïf
  • Apprentissage par mémorisation de prototypes: k plus proches voisins, algorithme LVQ
Méthodes d'enseignement
  • Cours magistraux
  • Projets incluant questions théoriques et applications pratiques. Ces projets sont implémentés dans le langage python. Ils sont soumis et évalués sur la plateforme Inginious.
Modes d'évaluation
des acquis des étudiants

Calcul de la note globale pour le cours

En première session,  la note globale du cours est exclusivement basée sur les projets soumis et évalués durant le quadrimestre.
Cette note globale est calculée, juste après la correction du dernier projet, comme une moyenne pondérée des 5 projets du cours, selon la pondération suivante :
  • projet 1 = 10 %
  • projet 2 = 15 %
  • projet 3 = 10 %
  • projet 4 = 15 %
  • projet 5 = 50 %
En seconde session, les projets ne sont pas ré-évalués et ne peuvent donc pas être soumis à nouveau. Les notes des projets 1 à 4 sont conservées telles quelles, alors que le projet 5 est remplacé par un examen écrit à livre fermé. Cet examen s'effectue, par défaut, sur papier ou, le cas échéant, sur ordinateur. La note globale est calculée avec la même pondération qu'en première session, l'examen écrit comptant en particulier pour 50% de la note globale (en remplacement de celle du projet 5).

Règles concernant les collaborations entre étudiants et l'usage de ressources externes

Une étude collaborative entre les étudiant.e.s est encouragée via un forum d'échanges sur Moodle. Chaque étudiant.e doit néanmoins soumettre une solution personnelle pour chaque projet. Le recours à des ressources publiques (p.ex. stackoverflow.com), ce-inclus des IA génératives (p.ex. chatGPT) est autorisé pour autant que chaque (fragment de) code soumis par l'étudiant.e mentionne toutes les ressources utilisées.
La diffusion ou l'échange entre étudiants de (fragments de) code ne sont pas autorisés par quelque moyen que ce soit (GitHub, Facebook, Discord, ...) et ce même après la date limite de remise des projets.
Le non-respect de ces règles sera considéré comme un plagiat et/ou tricherie et sera sanctionné conformément au Règlement Général des Etudes et des Examens.
Ces règles sont exposées et détaillées lors du premier cours (voir site Moodle du cours).
Bibliographie
Des ouvrages complémentaires sont recommandés sur le site Moodle du cours.
Additional textbooks are recommended on the Moodle site for this course.
Support de cours
  • Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles depuis le site Moodle du cours.
  • Required teaching material include all documents (lecture slides, project assignments, complements, ...) available from the Moodle website for this course.
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] : ingénieur civil biomédical

Master [120] en statistique, orientation biostatistiques

Master [120] : ingénieur civil électricien

Master [120] en statistique, orientation générale

Master [120] : ingénieur civil en informatique

Master [120] en sciences informatiques

Master [120] : ingénieur civil en mathématiques appliquées

Master [60] en sciences informatiques

Master [120] : ingénieur civil en science des données

Certificat d'université : Statistique et science des données (15/30 crédits)

Master [120] en science des données, orientation technologies de l'information

Master [120] : ingénieur civil en génie de l'énergie