Début : Octobre 2007 |
Cette recherche vise à développer un modèle de difficulté linguistique capable d'estimer automatiquement la difficulté contextuelle de textes ou de phrases selon l'échelle du CECR (Cadre Européen Commun de Référence pour les Langues). Par "difficulté contextuelle", nous entendons l'obstacle que peut présenter, lors la réalisation d'une tâche d'apprentissage, la phrase ou le texte servant de support à cette tâche. Une fois cette complexité rendue mesurable, il est plus facile d'utiliser les matériaux ainsi évalués pour la conception automatique d'exercices de FLE adaptés à un niveau donné d'apprentissage.
Plus précisément, cette recherche vise à :
- développer une méthodologie qui permette de classer automatiquement des textes ou des phrases selon leur niveau de difficulté ;
- tester l'efficacité de diverses variables linguistiques comme indices de la difficulté ;
- comparer les performances de différentes techniques de classification (régression logistique, arbres binaires ou autres algorithmes issus du data mining), en fonction de nos données et de particularités de la tâche ;
- en se basant sur les résultats de ces questionnements théoriques, proposer un modèle de lisibilité optimal utilisable au sein d'applications didactiques de FLE ;
- enfin, effectuer une phase de validation en soumettant à des apprenants d'un niveau déterminé des textes ou des phrases sélectionnés par le modèle.
Chercheur
Thomas François
Promoteurs
- Prof. Cédrick Fairon (CENTAL)
- Prof. Anne-Catherine Simon (VALIBEL)