Séminaires du Cental

CENTAL

Chaque séminaire du CENTAL a pour but de réunir des enseignants, des étudiants et des chercheurs (du monde académique ou de l'industrie) intéressés par le traitement automatique de langues et se déroule dans le local C142 du CENTAL (Collège Erasme). Ces séminaires sont gratuits et ouverts à tous.

Les séminaires ont généralement lieu le vendredi, mais les horaires voire les jours peuvent être variables. Veillez à bien consulter les dates et horaires ci-dessous pour chaque séminaire.

Si vous souhaitez être informé par courrier électronique des séminaires que nous organisons et des actualités du CENTAL, nous vous proposons de vous inscrire à la liste de diffusion du CENTAL en indiquant votre adresse électronique dans le formulaire.

 

Programme 2016-2017 des Séminaires du CENTAL

 


PREMIER QUADRIMESTRE



Vendredi 7 octobre 2016
de 14h à 15h

Leonardo Zilio (INF, Universidade Federal do Rio Grande do Sul & CENTAL, UCL)

Semantic Role Labeling and Lexical Simplification:  two samples of NLP applications

This seminar will present to two studies that have different goals. On the first part, we will show the processes behind a semantic role labeling study, starting from corpus selection and parsing, and moving to argument extraction and semantic annotation. This includes the development of a subcategorization frames extractor for Brazilian Portuguese, and an annotation process that was carried out manually. The resulting resource contains more than 15 thousand arguments annotated for 192 verbs. On the second part, we will show two experiments that were developed around an overarching lexical simplification project. The first one deals with word embeddings and semantical relations among words, where the objective was to use word embeddings and a lexical resource (BabelNet) to generate a dictionary of synonyms, hypernyms and antonyms. The resource was automatically and manually validated, presenting 60,7% of validated entries, resulting in a dictionary of 2,875 validated relations. The second experiment was the generation of a gold standard, a training/test set for complex word identification and a dictionary for lexical simplification, using classic literature texts as corpus. The texts were processed using parsing and a frequency list index to facilitate the manual annotation process. A total of 3,720 manual annotations were carried out and later transformed into each of the resources.

PDF Télécharger la présentation

 



Vendredi 28 octobre 2016
de 14h à 15h

Orphée De Clerq (LT3, UGent)

UCL: great beer at the “cercles", but very dirrrrty!!
Aspect-based sentiment analysis of customer reviews: an overview of the task and its main challenges

The original objective of sentiment analysis, a very popular NLP task, has been to automatically classify an entire document or sentence as positive, negative or neutral. This, however, does not allow to discover what people like and dislike exactly. Often, users are not only interested in people’s general sentiments about a certain product, but also in their opinions about specific features, i.e., parts or attributes of that product. This comes down to a very fine-grained task, known as aspect-based sentiment analysis (ABSA) and is the topic of this seminar.

We will see that ABSA actually comprises several subtasks -aspect term extraction, aspect term classification and aspect polarity classification- each requiring a different approach. We will have a closer look at the current state of the art for each of these subtasks and focus on supervised machine learning techniques for processing English and Dutch restaurant reviews. To conclude, we will discuss some of the main challenges the domain is still facing, which illustrates that this task is far from solved.

PDF Télécharger la présentation

 



Vendredi 18 novembre 2016
de 15h à 16h

Cédric Lopez (VISEO, Grenoble)

SMILK : du TALN au LOD. Représentation des connaissances, extraction d’entités et relations, liage et visualisation

Un des objectifs du laboratoire commun SMILK (Social Media Intelligence and Linked Knowledge, LabCom ANR) concerne l’étude du couplage du Traitement Automatique du Langage Naturel (TALN) au Linked Open Data (LOD). Pour atteindre cet objectif, nos recherches portent sur : 1) l’extraction d’entités d’intérêt et de leurs relations dans un contenu textuel non structuré, 2) la représentation des connaissances extraites, 3) le liage des données extraites avec les données du LOD, 4) la visualisation et l’exploration des données liées.

La présentation fera l’état de nos recherches et nous démontrerons les possibilités issues des résultats de recherche par le biais d’un prototype prenant la forme d’un plugin de navigateur ayant pour principale ambition d’enrichir les connaissances des utilisateurs naviguant sur le Web. Au fur et à mesure de la navigation sur le Web, le système peuple la base de connaissance et tisse des liens avec le Web des données ouvertes que l’utilisateur peut parcourir.

 


Vendredi 25 novembre 2016 de 14h à 15h

Mathieu Constant (ATILF, Université de Lorraine)

Identification des expressions poylexicales et analyse syntaxique en dépendances

Les expressions polylexicales (EP) sont des séquences formées de plusieurs mots se caractérisant par un certain degré de non-compositionalité que ce soit au niveau morphologique, lexical, syntaxique, sémantique ou/et pragmatique. Leur identification est cruciale pour les différentes applications du traitement automatique des langues.

Dans cet exposé, nous nous intéressons à l’intégration de l’identification des EP au sein de l’analyse syntaxique en dépendances statistique. Après avoir évoqué les différents défis liés à l’identification automatique des EP, nous aborderons ce sujet en essayant de répondre à deux problématiques: (1) trouver une représentation la plus riche possible des expressions polylexicales au regard de l’analyse syntaxique; (2) adapter les algorithmes d’analyse existants pour prédire de manière jointe l’analyse lexicale et syntaxique d’une phrase dans cette représentation. En particulier, nous montrerons de nouvelles représentations factorisées sur deux dimensions, ainsi que de nouveaux algorithmes d’analyse syntaxique intégrant des mécanismes spécifiques pour l’identification des EP.

Cette présentation est le fruit d'un travail collaboratif avec Marie Candito (Univ. Paris-Diderot), Joseph Le Roux (Univ. Paris-Nord), Joakim Nivre (Uppsala University) et Nadi Tomeh (Univ. Paris-Nord).

 



Vendredi 2 décembre 2016
de 14h à 15h

Séminaire co-organisé avec la Louvain School of Translation and Interpreting (LSTI)

Ruslan Mitkov (RGCL, University of Wolverhampton)

The new generation of translation memories

 

 

 


DEUXIEME QUADRIMESTRE


 

 


 

 

 


> Autres séminaires :

    • Séminaire du LADL (Univ. Marne-la-Vallée)
    • Séminaire du LLI (Univ. Paris 13)
    • Séminaire du Alpage (Univ. Paris 7)