5.00 crédits
30.0 h + 15.0 h
Q1
Enseignants
Dupont Pierre;
Langue
d'enseignement
d'enseignement
Thèmes abordés
- Différents niveaux d’analyses linguistiques
- Traitements de corpus
- Etiquettage en parties du discours
- Modélisation probabiliste du langage (Ngrams et Modèles de Markov Cachés)
- Grammaires formelles et algorithmes d’analyse syntaxique
- Traduction automatique, apprentissage profond
- Applications en ingénierie linguistique telles que les logiciels de complétion automatique, d’étiquettage automatique, d’analyse ou de traduction automatique
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants : INFO1.1-3 INFO2.3-4 INFO5.3-5 INFO6.1, INFO6.4 Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants : SINF1.M4 SINF2.3-4 SINF5.3-5 SINF6.1, SINF6.4 Les étudiants ayant suivi avec fruit ce cours seront capables de
|
Contenu
- Différents niveaux d'analyse linguistique
- Traitement (automatisé) de corpus : formatage, tokenization, marquage des données
- Modélisation probabilistes du langage : N-grams, HMMs
- Etiquetage en parties du discours
- Introduction à l'apprentissage profond
- Réponse aux questions
- Traduction automatique
- Applications représentatives telles que la génération automatique de texte, le marquage automatique de parties de texte, la traduction automatique ou agents conversationnels
Méthodes d'enseignement
- Cours magistraux
- Projets pratiques implémentés en Python sur le serveur Inginious
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
Calcul de la note globale pour le cours
Les projets valent pour 30 % de la note finale, 70 % pour l'examen final (à livre fermé).Les projets ne peuvent pas être refaits en seconde session. La note globale des projets est fixée à la fin du quadrimestre et reprise telle quelle dans la note finale en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur un ordinateur).
Règles concernant les collaborations entre étudiants et l'usage de ressources externes
Une étude collaborative entre les étudiant.e.s est encouragée lors des séances de suivi de projets et via un forum d'échanges sur Moodle.Chaque étudiant.e doit soumettre une solution personnelle pour chaque projet. Le recours à des ressources publiques (p.ex. stackoverflow.com), ce-inclus des IA génératives (p.ex. chatGPT) est autorisé pour autant que chaque (fragment de) code soumis par l'étudiant.e mentionne toutes les ressources utilisées.
La diffusion ou l'échange entre étudiants de (fragments de) code ne sont pas autorisés par quelque moyen que ce soit (GitHub, Facebook, Discord, ...) et ce même après la date limite de remise des projets.
Le non-respect de ces règles pour n'importe quel projet peut entraîner une note globale de 0 pour l'ensemble des projets.
L'examen final sur ordinateur doit se faire sans accès à aucune ressource externe.
Ces règles sont exposées et détaillées lors du premier cours (voir site Moodle du cours).
Ressources
en ligne
en ligne
Bibliographie
One recommended textbook - un ouvrage conseillé :
- Speech and Language Processing, D. Jurafsky and J.H. Martin, Prentice Hall.
Support de cours
- Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles depuis le site Moodle du cours.
- Required teaching material include all documents (lecture slides, project assignments, complements, ...) available from the Moodle website for this course.
Faculté ou entité
en charge
en charge
INFO
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en science des données, orientation statistique
Master [120] en linguistique
Master [120] : ingénieur civil en informatique
Master [120] en sciences informatiques
Master [120] : ingénieur civil en science des données
Master [120] en science des données, orientation technologies de l'information