Aller au contenu principal

Job : gestionnaire de données

cental | Louvain-la-Neuve

cental
16 July 2021, modifié le 6 December 2024

 

  • taux d’emploi à convenir (entre 50% et 100%) pour une durée déterminée de 12 mois (avec possibilité de prolongation)
  • pour l'Institut langage et communication (ILC), du Secteur des sciences humaines (SSH)
  • à Louvain-la-Neuve
  • entrée en fonction: immédiate

Contexte

La recherche actuelle fait un usage massif de données langagières écrites et orales, dans différentes langues (français, espagnol, anglais, néerlandais, etc.). Pour être exploitables, ces données langagières doivent être documentées (métadonnées), anonymisées (afin de respecter les règles sur les données personnelles), enrichies d’annotations (transcription, indexation, analyse thématique, etc.) et déposées dans des bases de données interrogeables en ligne. C’est à ces différentes tâches que le ou la gestionnaire de données contribuera au sein de l’Institut Langage et Communication (ILC), et plus particulièrement du pôle de recherche en linguistique (PLIN) et de la plateforme CENTAL (Centre de Traitement automatique du langage).

Fonction

En collaboration avec les chercheurs de PLIN/ILC, le ou la gestionnaire de données a pour fonctions de :

  • Superviser la chaine de traitement de constitution des corpus oraux et écrit (acquisition des données, documentation des métadonnées, transcriptions et annotations, versement dans les bases de données existantes, standardisation des formats utilisés)

  • Développer des outils de prétraitement et de traitement des données (segmentation, alignement du texte au son, alignement texte-texte, annotation automatique ou semi-automatique, etc.)

  • Assurer une veille technologique pour l’interopérabilité des données (documentées et traitées selon les standards internationaux, cf. Clarin, Ortolang, Olac, etc.) et l’amélioration de l’acquisition des données (automatic speech recognition, tokenisation, etc.)

  • Veiller au respect des conventions juridiques et éthiques liées à la protection des données (RGPD)

  • Représenter l’UCLouvain dans différents consortiums internationaux des données en linguistique.

Qualifications et aptitudes requises

Le ou la candidat.e répondra aux qualifications suivantes :

  • titulaire d’un diplôme de Master en Linguistique, Finalité spécialisée en Traitement automatique du langage, ou équivalent

  • compétences de programmation : Perl et/ou Python, bonne connaissance du XML

  • capacité à traiter des données langagières dans plusieurs langues (français, anglais, néerlandais, espagnol, allemand, etc.)

  • connaissance de l'anglais (B2) et en particulier de l'anglais académique (pour participer à des réunions internationales et contribuer aux publications de recherche)

  • sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité

  • des notions en statistiques linguistiques sont un plus

Votre candidature

(fichier unique avec lettre de candidature, curriculum vitae, photo récente en format d'identité) est à transmettre pour le 15 août à l'adresse suivante: anne-catherine.simon@uclouvain.be.

Sur la base de ces documents, les candidat·e.s seront, le cas échéant, sélectionné·e.s pour un entretien qui se fera le 18 août via Teams.