Évaluation automatique de la compétence écrite des apprenants en FLE

CENTAL Louvain-La-Neuve

Résumé du projet / Project summary

Français

Ce projet comporte un double volet articulé autour de la problématique de l’évaluation automatique de la compétence écrite des apprenants du français langue étrangère (FLE). Dans un premier temps, en profitant d’une collaboration avec France Éducation International, nous constituerons le plus large corpus de productions d’apprenants pour le FLE. Ce corpus d’apprenants nous permettra de constituer un inventaire de phénomènes linguistiques et d’estimer leur distribution sur les six niveaux du Cadre européen commun de référence pour les langues (CECR). Dans un second temps, nous développerons un algorithme d’intelligence artificielle capable d’associer à une production écrite d’apprenants l’un des six niveaux du CECR. Il sera également capable d’identifier automatiquement dans une production d’apprenant les phénomènes linguistiques repris dans notre inventaire et de leur associer un niveau CECR, de manière à proposer un diagnostic détaillé du niveau de compétence de cet apprenant à différents niveaux linguistiques. Une évaluation des performances de ce modèle et de son utilité dans la formation de futurs évaluateurs de langues sera réalisée.

English

This project looks at the issue of automatic assessment of the written competence of learners of French as a foreign language (FFL) from a two-pronged perspective. First, by building on a collaboration with France Éducation International, we will compile the largest corpus of learner productions for FFL. This learner corpus will enable us to build up an inventory of linguistic phenomena and to estimate their distribution over the six levels of the Common European Framework of Reference for Languages (CEFR). In a second step, we will develop an artificial intelligence algorithm capable of assigning one of the six levels of the CEFR to a learner's written production. It will also be able to automatically identify the linguistic phenomena included in our inventory in a learner's production and link them to a CEFR level. This will enable us to provide a detailed diagnosis of the level of competence of this learner from different linguistic levels. An evaluation of the performance of this model and its usefulness for the training of future language assessors will be carried out.

Équipe / Team

Dr. Rodrigo Wilkens

Dates

2021-...

Partenaires / Partners

 

Financement / Funding