Séminaires du CENTAL (Archives 2013-2014)

PROGRAMME 2013-2014

PREMIER QUADRIMESTRE

Vendredi 4 octobre 2013 de 13h à 14h

Thomas François (Cental, Université catholique de Louvain)

Le TAL pour l'assistance à la lecture : lisibilité et simplification automatique de textes

Résumé :

Dans un monde où la communication écrite est de plus en plus cruciale, diverses applications de TAL cherchent à assister les lecteurs éprouvant des difficultés. Parmi celles-ci, on compte les modèles de lisibilité, qui visent à évaluer automatiquement la difficulté des textes en fonction d'une population ciblée de lecteurs. Ces modèles peuvent, par exemple, aider à sélectionner plus rapidement des documents en vue d'une application scolaire, servir à signaler à des rédacteurs que le niveau de leur production risque de poser des difficultés de compréhension à certains de leurs destinataires ou encore filtrer les requêtes web d'utilisateurs désireux de trouver des textes correspondant à leur niveau (en particulier dans le cadre de l’apprentissage de langues étrangères).
Dans notre présentation, nous reviendrons tout d'abord sur les grandes étapes du domaine de la lisibilité, essentiellement développé pour l'anglais. Nous présenterons les méthodologies qui sont employées actuellement en soulignant certaines de leurs limitations, puis rapporterons des expériences effectuées, sur le français, dans deux types de contextes : des documents extraits de manuels de FLE (français langue étrangère) et des textes administratifs. Ces expériences ont conduit à l'élaboration de formules de lisibilité, aptes à évaluer la difficulté de textes de FLE et de textes administratifs.
Nous terminerons cette communication par une brève introduction à un domaine proche de la lisibilité, dont l'objectif est cette fois de faciliter l'accès à des textes complexes : la simplification automatique de textes. Nous présenterons quelques-unes des perspectives qu'il offre, avant de décrire brièvement deux études réalisées au CENTAL dans ce domaine : une première approche de la simplification syntaxique et ReSyf, une ressource de synonymes gradés pour la simplification lexicale.

mots-clefs : lisibilité, TAL, classification de textes, simplification de textes.

Télécharger la présentation

18 octobre 2013 de 14h à 15h

Marc Borry (Chief Knowledge Officer, Police fédérale, Bruxelles).

Les apports d'une carthographie des connaissances à la mise en place d'une politique de Knowledge Management à la police fédérale belge.

Résumé :

Pour mettre en place une gestion des connaissances efficace à la police, une cartographie des domaines de connaissances a été réalisée à partir des éléments de structurations existants et de confrontations avec les experts. L’exposé détaillera les étapes de cette élaboration de la cartographie et ses applications dans une démarche collaborative de gestion de l’information et des connaissances au travers du lien fort avec les personnes.

Télécharger la présentation

6 décembre 2013 de 14h à 15h

Natalia Grabar (STL, Université de Lille 3).

Autour de la Health Literacy

Résumé :

Health Literacy correspond à la facilité avec laquelle un patient peut comprendre un texte médical, souvent lié à sa condition de santé. La difficulté principale observée est que, dans le domaine médical, des mots ou termes techniques (comme abdominoplastie, dermabrasion ou hépatoduodénostomie) sont largement utilisés, alors que leur compréhension est difficile pour les patients, tout en étant nécessaire pour (1) leur bon suivi médical, (2) une communication réussie avec les médecins et, (3) de manière plus générale, le succès de soins médicaux qui leur sont prodigués.

Afin de contribuer à ce champ de recherche, nous proposons différentes expériences visant à effectuer une distinction automatique entre les unités linguistiques (discours, documents ou mots) selon leur niveau de technicité ou de spécialisation, et donc selon leur niveau de difficulté de compréhension attendue auprès des patients. Les expériences montrent qu'il existe plusieurs traits inhérents à ces unités linguistiques, qui rendent la distinction possible. D'autres expériences sont cependant nécessaires pour approfondir et consolider l'analyse, et pour apporter des solutions plus tangibles.

Télécharger la présentation

DEUXIÈME QUADRIMESTRE

Vendredi 21 mars 2014 de 14h à 15h

Olivier Curé (LIGM, Université Paris-Est Marne-la-Vallée)

Exploitation d’ontologies dans le cadre d’une application médicale pour le grand public

Résumé :

Dans cet exposé, je présente des travaux récents qui ont été menés dans le cadre du développement d’une application d’automédication. Cette application a pour objectif d’informer le grand public sur les médicaments de prescription facultative et les symptômes associés. L’application comporte de nombreuses fonctionnalités développées autour de différentes ontologies exploitant les technologies du Web Sémantique, e.g., requêtage et raisonnement. Cette présentation mettra en évidence nos contributions, en particulier le développement et l’enrichissement d’ontologies par induction et le support nouvelles contraintes d’intégrité participant à améliorer la qualité de données.

Télécharger la présentation

Vendredi 28 mars 2014 de 14h à 15h

Sowmya Vajjala (Université de Tübingen)

Analysing text readability with linguistic modeling

Résumé :

Automatically assessing the reading level of a text can be useful in a range of application scenarios, for e.g., in providing reading materials for language learners and for personalizing the search results based on the user's reading ability. In this talk, I will first provide an overview about contemporary research in readability assessment and then describe my current research in analysing text readability using linguistically motivated features.

Télécharger la présentation

Vendredi 4 avril 2014 de 14h à 15h -> Séminaire annulé

Jean-Léon Bouraoui (Société Prométil, Toulouse)

Analyse sémantique des "textes d'exigences" : pour une assistance automatique à la rédaction Patrick Saint-Dizier (IRIT, Toulouse), Jean-Léon Bouraoui, Juyeon Kang, (Société Prométil, Toulouse)

Résumé :

Les textes d'exigences sont fréquemment utilisés dans les industries (aéronautique, transports, télécoms ...). Ils servent à écrire les modalités d'application des spécifications d'un produit, d'un service, ou d'une procédure.
Dans ce contexte, nous proposons un système d'analyse linguistique automatique de ce type de textes, afin d'en détecter les problèmes de rédaction : structures trop complexes, termes inadaptés, incohérences, etc. Le but est de pouvoir ainsi proposer au rédacteur des suggestions de correction, afin d'éviter des problèmes d’inintelligibilité ou de mauvaise compréhension de ces textes. En effet, plusieurs études montrent que la majorité des problèmes d'exécution de ces textes, menant à des retards, voire des accidents industriels, sont causés par une mauvaise interprétation de ces textes au moment de leur application.
Nous présenterons dans un premier temps ce contexte d'application de notre système; nous décrirons ensuite celui-ci, avec des exemples concrets d'utilisation.

Vendredi 25 avril 2014 de 14h à 15h

Stéphanie Weiser, Serkan Eryilmaz (Société Earlytracks)

Extraction d'information pour applications spécialisées : exemple du domaine médical

Résumé :

L'objet de ce séminaire est de présenter trois applications concrètes au cœur desquelles se trouve l'extraction d'information. La première est un moteur de recherche spécialisé pour un domaine. La deuxième est un annotateur d'événements [au sens de relation typée entre plusieurs entités]. La troisième permet, à partir de textes médicaux, d'associer les codes ICD10 correspondant aux termes présents pour faciliter la codification qui est actuellement faite manuellement.

Ces trois applications feront l'objet d'une démonstration. Nous aborderons également les problématiques communes mais aussi spécifiques de ce type d'outil, aussi bien au niveau linguistique (constitution de ressources lexicales, annotation de corpus) qu'informatique (indexation)

Menu

cental | Louvain-la-Neuve