Séminaires du CENTAL (Archives 2018-2019)

CENTAL Louvain-La-Neuve

Organisation 2018-19

Anaïs Tack
Violeta Gutierrez Figueroa

Calendrier 2019-20

Premier quadrimestre

Multiword expression identification: how far have we got?

Carlos Ramisch (LIS - Aix-Marseille Université)

I will talk about multiword expression identification, that is, given an input text, we try to automatically identify (and categorise) the tokens belonging to multiword expressions in it. This task can be extremely useful to avoid errors in parsing and semantic applications that tend to process multiword expressions compositionally, word by word, whereas they must be treated as a unit. I will present an overview of the PARSEME corpora and shared task focusing on verbal expressions. Then, I will talk about two systems developed in our group for this task: an old-fashioned rule-based system submitted to the DiMSUM shared task, and a more trendy one, based on recurrent neural networks and submitted to the PARSEME shared task 2018. I will conclude my talk with a some philosophical digression on whether multiword expressions are nowadays still a pain in the neck, or if deep learning transformed their identification into a piece of cake.

diapositives : ici

Vendredi 19 octobre 2018 ∙ 14h-15h ∙

Collège Érasme c.142

26.10 — Pascal Amsili — Autour de la résolution automatique de la coréférence : définition de la tâche, modélisation cognitive, schémas Winograd.

Pascal Amsili ∙ LLF
Lattice (Université Paris-Diderot)

Je vais présenter dans cet exposé plusieurs travaux récents menés dans notre équipe autour de la résolution automatique de la coréférence. Nous commencerons par revenir sur la tâche de résolution des coréférences telle qu'elle est définie en TAL. Sur la base des travaux de Master de Quentin Gliosca, nous montrerons qu'une nouvelle définition de cette tâche, basée sur les têtes et non sur les empans, peut se révéler plus utile à la communauté, plus facile à évaluer, et offrir de meilleures performances.

Nous parlerons ensuite de l'utilisation de modèles computationnels de résolution des coréférences pour simuler de façon cognitivement plausible le comportement humain sur cette tâche. Les travaux de thèse d'Olga Seminck montrent que si c'est une tâche difficile, cela peut se révéler utile à la fois pour les psycholinguistes qui élaborent des modèles et pour les chercheurs en TAL qui cherchent de nouvelles sources d'inspiration.
Selon le temps, nous évoquerons aussi des travaux que nous menés, en collaboration avec Olga Seminck et de nombreux stagiaires, sur les schémas Winograd. Il s'agit de phrases comportant un pronom dont l'antécédent est évident pour la quasi-totalité des humains, mais très difficile à résoudre pour un système automatique. Nous rapporterons diverses expériences statistiques et psycholinguistiques que nous avons menées sur la collection française de schémas Winograd que nous avons élaborée.

Slides ici

Vendredi 26 octobre 2018 ∙ 14h-15h

Collège Érasme c.142

09.11 — Yves Peirsman —  Natural Language Processing in Industry: State of the Art and Remaining Challenges

Yves Peirsman ∙
NLP Town (www.nlp.town)

Natural Language Processing is going through exciting times. After the breakthrough of Deep Learning, new advances in transfer learning and multi-task learning open up many opportunities for the wide application of language technology. Still, it can be surprisingly challenging to apply NLP successfully in a business context. In this talk, I will give an overview of some successful NLP applications in various sectors, and identify the main challenges for the wide adoption of NLP in industry.

Slides ici

Vendredi 9 novembre 2018 ∙ 14h-15h ∙

Collège Érasme c.142

30.11 — Xavier Tannier — Analyse automatique de comptes-rendus hospitaliers : approches supervisées, non supervisées, hybrides

Xavier Tannier ∙ Inserm
LIMICS (Université Paris-Sorbonne)

Vendredi 30 novembre 2018 ∙ 14h-15h ∙

Collège Érasme c.142

Deuxième quadrimestre

22.03 — David Fredrich — Proposition d'un système d'aide à la décision dans le domaine juridique

David Fredrich ∙
sprl LegalTech4you ∙ HELMo

Vendredi 22 mars 2019 ∙ 10h-11h ∙

Collège Dupriez d.144

05.04 — Nùria Gala — Outils et méthodes pour l'aide à la lecture : vers une simplification automatique de textes pour un meilleur décodage et compréhension

Núria Gala ∙ Aix Marseille Université ∙
Laboratoire Parole et Langage, FR

Vendredi 5 avril 2019 ∙ 11h-12h ∙

Collège Dupriez d.144