Job : chercheur·euse post-doctoral·e

CENTAL Louvain-La-Neuve

L'UCLouvain recherche

un chercheur ou une chercheuse post-doctoral·e en machine learning ou en traitement automatique du langage

  • CDD postdoctoral à temps plein (100%) pour une durée d’un an, renouvelable deux fois

  • pour le Centre de traitement automatique du langage (CENTAL), de l'Institut langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)

  • entrée en fonction: septembre 2021


Cette proposition de poste postdoctoral s’intègre dans le cadre d’un ambitieux projet de recherche réalisé par le Centre de traitement automatique du langage (CENTAL, https://uclouvain.be/fr/instituts-recherche/ilc/cental), en collaboration avec FEI (France Éducation International, https://www.france-education-international.fr/). Le financement est prévu pour 3 ans, mais cette offre prend la forme d’un CDD d’une année, qui sera normalement prolongé, moyennant la réalisation des objectifs du projet de recherche.

Le projet dans son ensemble mobilisera plusieurs chercheurs afin de mettre au point une solution automatisée d’aide et d’assistance à la correction d’épreuves d’expression écrite en langue française, à des fins d’évaluation certificative. Plus précisément, il s’agira de développer un système qui soit capable (1) d’évaluer automatiquement le niveau de l’expression écrite des candidats en entraînant une solution d’intelligence artificielle sur les données de FEI et (2) de fournir divers diagnostics basés sur des ressources pédagogiques en FLE. Le premier objectif de ce projet se situe dans la lignée des travaux réalisés pour l’anglais visant à évaluer automatiquement les productions d’apprenants en lien avec l’échelle du CECR (Tack et al., 2017; Arnold et al., 2018; Yannakoudakis et al., 2018; Baillier et al., 2019). Le second objectif se situe dans la lignée des travaux du CENTAL sur l’apport d’un diagnostic sur la complexité d’une production écrite (CEFRLex dans François et al., 2014; Pintard et François, 2020 ou AMesure dans François et al., 2020).

Le rôle du chercheur ou de la chercheuse postdoctoral engagé consistera principalement à (1) préparer le corpus de FEI en vue d’un traitement statistique, (2) implémenter, sous la forme d’un package python, un extracteur de variables linguistiques (par ex. mesurant la complexité du lexique ou des structures syntaxiques, cf. Tack et al., 2017) et pédagogiques (par ex. itinéraires d’acquisition, cf. Bartning et Schyler, 2004) corrélées avec le niveau CECR des productions d’apprenants du FLE, (3) développer un modèle IA capable de prédire ce niveau CECR automatiquement et (4) le tester auprès d’évaluateurs humains. Le chercheur ou la chercheuse devra également assurer la diffusion des résultats obtenus via des publications scientifiques et la rédaction de rapports annuels. Il ou elle sera amené à collaborer étroitement avec les autres membres de l’équipe en vue d’assurer la bonne réalisation de ces tâches.

Environment de travail

Le CENTAL est rattaché à l’Institut Langage & Communication (https://uclouvain.be/fr/instituts-recherche/ilc), qui fait partie de l’UCLouvain. Cette université est située à Louvain-la-Neuve (https://uclouvain.be/fr/sites/louvain-la-neuve), une ville piétonne, agréable à vivre et très dynamique. Le projet de recherche sera réalisé sous la direction du Pr. Thomas François (https://cental.uclouvain.be/team/tfrancois/), expert en lisibilité et en simplification automatique de la langue. Des missions à Paris (Sèvres) sont prévues afin d’assurer une bonne collaboration avec FEI. Cet organisme est mondialement reconnu pour son expertise dans le domaine de l’évaluation des niveaux de compétence en français langue étrangère (FLE) et est en charge de l’organisation des principaux tests de langues en français, à savoir le TCF, le DELF, ou le DAFL.

Qualifications et aptitudes requises

Le candidat répondra aux qualifications suivantes :

  • Être porteur d’une thèse de doctorat en Informatique, en Linguistique computationelle, en Traitement automatique du langage (TAL) ou équivalent.
  • Au vu des tâches à réaliser, d’excellentes compétences informatiques sont requises :
    • langages de programmation : Python (maîtrise)
    • la connaissance de scikit-learn, pandas, TensorFlow, PyTorch ou Keras est un plus.
    • technologies web : HTML, Javascript, CSS, Flask, MySQL et PostgreSQL
    • systèmes : Linux (gestion de serveurs)
    • Une expérience dans la création de modules en python diffusés sur github (ou équivalent) est un plus.
  • La connaissance des principaux algorithmes en apprentissage supervisé est requise. La connaissance des réseaux de neurones profonds est un plus.
  • Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance de l’anglais (niveau B2 minimum)
  • Excellent profil au niveau de la recherche (publications, conférences, etc.)
  • Bonne connaissance des principaux outils et algorithmes du TAL
  • Une expérience de recherche dans l’un des domaines suivants est un plus : apprentissage des langues assisté par ordinateur, lisibilité, évaluation automatique d’essai, language assessment, etc.
  • Autonomie, sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité.

Conditions d’engagement

Ce CDD postdoctoral est soumis aux conditions suivantes :

  • CDD d’un an, renouvelable deux fois (total de trois ans possible sur le projet).
  • En fonction de l’ancienneté, la rémunération brute peut varier de 4250 euros à 4850 euros par mois.

Ce poste requiert normalement d’être domicilié en Belgique. Les candidats hors UE sont responsables de l’obtention d’un visa et des permis requis, avec le soutien du département concerné de l’UCLouvain.

Dossier de candidature

Date limite de remise du dossier : 30 juin

Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de candidature à Thomas François par mail (thomas.francois@uclouvain.be). Celui-ci devra inclure :

  1. un curriculum vitae détaillé en français reprenant les différentes qualifications et aptitudes requises ainsi que les publications et autres expériences académiques et scientifiques ;
  2. une lettre de motivation en français, décrivant votre intérêt pour le poste, comment votre profil répond à la description du poste et aux objectifs du projet, etc. ;
  3. une lettre de référence en français ou en anglais.

Les candidats retenus seront invités à participer à un entretien via vidéo-conférence selon des modalités qui leur seront ensuite transmises par mail.

Publié le 12 mai 2021