Les cahiers du CENTAL

CENTAL Louvain-La-Neuve

La collection Cahiers du CENTAL est une publication du Centre de traitement automatique du langage. Ses objectifs principaux sont de contribuer à la diffusion des travaux en linguistique et linguistique informatique et de participer à la promotion de ces disciplines. Elle est publiée par les Presses universitaires de Louvain.

Lire quelques extraits de la collection sur Google Books

Comité scientifique de la Collection Cahiers du CENTAL


          

Index :

Language and the new (instant) media - 2018
Langage et sms. Une étude internationale des pratiques actuelles - 2015
eLexicography in the 21st Century: New Challenges, New Applications. Proceedings of eLex 2009 - 2010
Les tables  La grammaire du français par le menu - 2010
Description linguistique pour le traitement automatique du français - 2008
WAC3 - 2007
Le langage SMS - 2006
SMS pour la science - 2006
Verbum ex machina - 2006
Le français m'a tuer - 2006
Le poids de mots - 2004


Liste des volumes


Volume 9

Language and the new (instant) media
Louise-Amélie Cougnon, Barbara De Cock, Cédrick Fairon (eds)

In view of technological evolutions, the way people communicate has dramatically changed in less than two decades. Linguistic studies on the subject have been numerous and this is one of the reasons why the Linguistic Research Unit of the Language & Communication Institute (PLIN) of the Université catholique de Louvain decided in...  Lire la suite

In view of technological evolutions, the way people communicate has dramatically changed in less than two decades. Linguistic studies on the subject have been numerous and this is one of the reasons why the Linguistic Research Unit of the Language & Communication Institute (PLIN) of the Université
catholique de Louvain decided in 2016 to organize a one day workshop on this hot topic.
This follow-up volume is structured in two main sections. The first section (From automatic processing…) focuses on automatic processing of language and offers chapters related to automatized recuperation and transmission of information, as well as to automatized analyses of large new media corpora.
The second section (…to social impact) focuses on the social impact of new media as to writing processes, multimodal interaction and discursive processes. This distinction is of course in no way dichotomist, but rather points towards a different of focus of the chapters.
The variety of topics included is further evidence, if needed, that new media have an impact on almost any field of linguistics.

ISBN 978-2-87558-697-1

Commander


Volume 8

Langage et sms. Une étude internationale des pratiques actuelles 
Louise-Amélie Cougnon

Les nouvelles pratiques de l'écrit dans les technologies de la communication ont fait couler beaucoup d'encre: on s’inquiète de les voir « détruire la langue ». Pourtant, l’écrit sms n’est pas un nouveau langage, ni une nouvelle langue, mais un nouveau code écrit, un nouveau type de transcription. Comment la langue se réalise-t-elle dans ce petit écran de poche? La syntaxe et les mots sont-ils en péril? Telles sont les questions que pose cet ouvrage.
En se basant sur plus de 50 000 sms authentiques envoyés dans les quatre coins du monde, l’auteure propose une analyse détaillée de nombreux phénomènes linguistiques: de l’alternance des langues à l’usage de néologismes, en passant par l’emploi de régionalismes, l’étude propose également de nombreuses statistiques descriptives et inférentielles mettant en avant les tendances modernes de l’écrit sms.

ISBN 978-2-87558-371-0

Commander


Volume 7

"eLexicography in the 21st Century: New Challenges, New Applications. Proceedings of eLex 2009"
Sylviane Granger and Magali Paquot (eds)

The field of lexicography is undergoing a major revolution. The rapid replacement of the traditional paper dictionary by electronic dictionaries opens up exciting possibilities but also constitutes a major challenge to the field. The eLexicography in the 21st Century: New Challenges, New Applications conference organized by the Centre for English Corpus Linguistics of the Université catholique de Louvain in October 2009 aimed to bring together the many researchers around the world who are working in the fast developing field of electronic lexicography and to act as a showcase for the latest lexicographic developments and software solutions in the field. The conference attracted both academics and industrial partners from 30 different countries who presented electronic dictionary projects dealing with no less than 22 languages.
The resulting proceedings volume bears witness to the tremendous vitality and diversity of research in the field.
The volume covers a wide range of topics, including:

  • the use of language resources for lexicographic purposes, in the form of lexical databases like WordNet or corpora of different types
  • innovative changes to the dictionary structure afforded by the electronic medium, in particular multiple access routes and efficient integration of phraseology
  • specialised dictionaries (e.g. SMS dictionaries, sign language dictionaries)
  • automated customisation of dictionaries in function of users’ needs
  • exploitation of Natural Language Processing tools
  • integration of electronic dictionaries into language learning and teaching tools.

ISBN 978-2-87463-211-2

Sommaire
Commander

Volume 6

"Les tables
 La grammaire du français par le menu
"

par T. Nakamura, E. Laporte, A. Dister, C. Fairon.

Linguiste de talent, Christian Leclère a été pendant plus de 30 ans l’un des piliers du lexique-grammaire. Bien loin de l’image du savant dans sa tour d’ivoire (fût-elle de Jussieu), il a mené ses recherches sur la syntaxe des verbes, l’argot ou le figement tout en cultivant un sens unique du contact humain.

Ses collègues et amis lui rendent hommage dans cet ouvrage, au travers d’un ensemble d’articles évoquant directement ou indirectement quelques-uns de ses sujets de prédilection. Cette mosaïque de contributions témoigne non seulement du rôle scientifique majeur que Christian Leclère a joué, mais également des amitiés qui se sont tissées tout au long des années qu’il a passées sur le pont du LADL.

Préface par Jean-Claude Chevalier
Avec les contributions de :
Anne Abeillé et François Mouret, Jorge Baptista, Andrée Borillo, Pierre-André Buvet, Catherine Camugli Gallardo, Mirella Conenna, Matthieu Constant, Emilio D’Agostino, Annibale Elia, Karën Fort, Michel Gouet et Simonetta Vietri, Laurence Danlos, Benoît de Cornulier, Michele De Gioia, Dana-Marina Dumitriu et Ancuta Guta, Gaston Gross, Amr Helmy Ibrahim, So-Yun Kim, Jee-Sun Nam, Georges Kleiber, Jean René Klein, Tita Kyriacopoulou, Nunzio La Fauci, Béatrice Lamiroy, Éric Laporte, Danielle Leeman et Céline Vaguer, Peter A. Machonis, Ignazio Mauro Mirto, Pedro Mogorrón Huerta, Christian Molinier, Argyro Moustaki, Kozué Ogata, Mavina Pantazara, Sébastien Paumier, Mireille Piot, Comme Antoinette Renouf, Corinne Rossari, Morris Salkoff, Yoichiro Tsuruga, Harald Ulland

ISBN 978-2-87463-204-4

Sommaire
Commander


Volume 5

"Description linguistique pour le traitement automatique du français"
par M. Constant, A. Dister, L. Emirkanian, S. Piron.

Le Traitement automatique du langage repose largement sur l’exploitation de ressources linguistiques : dictionnaires, grammaires, thésaurus, corpus, etc. Aujourd’hui, ces ressources langagières digitales et les technologies du langage qui les manipulent sont devenues essentielles pour assurer la survie des langues dans la société de l’information.

Malgré les nombreux projets portant sur l’analyse automatique du français, les ressources consacrées à cette langue restent souvent insuffisantes. Les recherches présentées dans ce volume ont pour objectif principal de contribuer à combler cette lacune. Elles s’inscrivent dans l’approche linguistique en traitement automatique des langues et montrent la nécessité de décrire finement les phénomènes linguistiques, quel que soit le domaine auquel ils appartiennent.

Ces descriptions, couplées à la création ou à l’exploitation d’outils manipulant de vastes ensembles de données, permettent ainsi de rendre plus performants les traitements automatisés de la langue, comme la traduction automatique, le résumé de texte, la recherche d’information...

ISBN 978-2-87463-138-2

Sommaire
Commander

Rectificatifs : Piron - Nakamura - Widlocher


Volume 4

"Building and Exploring Web Corpora"

WAC More and more people are using data for linguistic and NLP research. The Web as Corpus workshop (WAC) provides a venue for exploring how we can use it effectively and the advancements to which this could lead.
This book is a collection of the talks presented at the 3rd WAC in Louvain-la-Neuve (Belgium). The focus is on the description of Web corpus collection projects, the exploration of Web data characteristics from a linguistics/NLP perspective, and on the use of crawled Web data for NLP purposes.
CLEANEVAL Any use of Web data requires that it be cleaned in order to get rid of unwanted material iuncluding, for example, HTML markup, navigation bars, adversisements. To date there has been no sharing of resources or expertise in this particular domain and the cleaning has often been done minimally. Cleaneval was an exercise aimed at promoting collaboration and improving our understanding of the issues. Results and perspectives are presented in this book.

ISBN 978-2-8746-3048-8

Sommaire
Commander


Volume 3,1

"Le langage SMS" par C. Fairon, J.R. Klein, S. Paumier

Pour la première fois, une étude scientifique propose une vision du « langage SMS ». Refusant de se fier aux intuitions ou aux impressions, les auteurs de cette étude linguistique, basée sur un corpus de données authentiques, bousculent les idées reçues. La brièveté des messages est-elle une règle ? Tout le monde utilise-t-il les mêmes abréviations ? Ces jeux de langue sont-ils nouveaux ? Est-ce un langage de jeunes ? Est-ce la ruine de l’orthographe française ?

Ce livre entraîne le lecteur dans les coulisses de ce projet scientifique avant de lui faire découvrir les trésors d’inventivité linguistique dont font preuve les usagers du SMS. Amateur de SMS, simple usager ou spécialiste de la langue... ce livre s’adresse à toute personne intéressée par le langage SMS ou par les méthodes d’investigation utilisées pour étudier la langue.

Accessible au grand public, mais sans concession sur la rigueur scientifique, cet ouvrage répondra également aux attentes des étudiants et des chercheurs qui y trouveront détails techniques et données chiffrées présentant la plus grande base de données linguistiques destinées à l’étude du langage SMS.

Vol 1 : ISBN 2-87463-048-4

Commander


Volume 3,2

 

"SMS pour la science" par C. Fairon, J.R. Klein, S. Paumier

En quelques années, la communication par SMS est passée du rang de simple procédé technique au rang de véritable phénomène de société. Intrigués, les sociologues, psychologues, linguistes et autres spécialistes des langues ou de la communication se penchent donc depuis peu sur ces nouvelles pratiques de communication, souvent située dans le cadre plus large de la communication médiée par ordinateur. Quand il est question de la langue, du “langage SMS”, les chercheurs mettent en avant la difficulté d'obtenir des données authentiques sur lesquelles faire reposer leurs études. Le premier objectif du corpus SMS pour la science est de répondre à cette attente en mettant à la disposition de la communauté scientifique un large corpus de SMS collectés dans un cadre expérimental contrôlé.

Le corpus diffusé sur ce CD-ROM est l'un des plus grands corpus de SMS existant à l'heure actuelle. Il compte 30.000 SMS rassemblés en Belgique francophone dans le cadre du projet “Faites don de vos SMS à la science” sous l'égide de deux centres de recherche de l'Université catholique de Louvain : le Centre de traitement automatique du langage (CENTAL) et le Centre d'études sur les lexiques romans (CELEXROM).

Deux particularités font de cette base de données une ressource exceptionnelle : TRANSCRIPTIONS : tous les messages ont été transcrits dans un français “normalisé”. Le logiciel d'interrogation permet de faire des recherches dans le texte standardisé et d'afficher les SMS originaux qui contiennent des variantes graphiques du mot recherché. PROFILS SOCIOLINGUISTIQUES : près de 90% des 2436 auteurs dont les messages sont rassemblés dans ce corpus ont répondu à un questionnaire sociolinguistique et à des questions portant sur leur pratique du SMS. Ces informations sont disponibles dans l'interface de consultation et peuvent également servir de critères de recherche.

Vol 2 : ISBN 2-87463-028-4

Commander


Volumes 2.1 et 2.2

"Verbum ex machina…" par P. Mertens, C. Fairon, A. Dister, P. Watrin

Les technologies du langage sont au cœur de cet ouvrage qui propose un panorama des recherches actuelles en traitement automatique des langues naturelles (TALN). Aux frontières de la linguistique et de l’informatique, le TALN s’est fait connaître du grand public au travers d’applications commerciales à succès telles que la correction orthographique et grammaticale, la traduction automatique ou encore la reconnaissance et la génération de la parole. Derrière la relative efficacité et - parfois - l’apparente simplicité et de ces outils se cachent de nombreux problèmes fondamentaux liés à la nature même des langues qui « résistent » à l’analyse informatique.

À l’heure où l’on bâtit la société de l’information, le traitement automatique des langues devient plus que jamais incontournable, car les langues - sous leur réalisation orale ou écrite - constituent l’un des principaux vecteurs de l’information. Rechercher, trier, résumer, analyser l’information à grande échelle et dans de nombreuses langues sont autant de tâches qui requièrent des logiciels « intelligents », capables de faire une percée dans le sens des textes.

La conférence internationale TALN 2006 a réuni durant quatre jours à Leuven (Belgique) quelque 150 spécialistes impliqués dans la recherche universitaire et la recherche en entreprise. Linguistes, informaticiens, statisticiens, psychologues, ils présentent dans ce volume leurs travaux actuels qui illustrent les défis rencontrés ainsi que les récentes avancées du traitement automatique du langage.

Vol 1 : ISBN 2-87463-023-3
Vol 2 : ISBN 2-87463-024-1

Sommaire
Commander


Volume 1

"Le français m'a tuer"

Parmi les sujets qui, dans l’enseignement supérieur, posent question, l’orthographe occupe une place de choix. Sans tomber dans un défaitisme stérile, on peut sans crainte reprendre le constat de La Fontaine et déclarer que si tous n’en meurent pas, tous en sont frappés. Ce « mal » semble affecter en effet la quasi-totalité des étudiants, qu’ils optent pour les sciences humaines ou exactes.

Malgré les cours de remise à niveau, de propédeutique ou de remédiation qui fleurissent dans toutes les écoles supérieures et les universités, en dépit de la nouvelle réforme de l’orthographe (1990), les écrits des étudiants – de la copie d’examen au courrier adressé à l’institution en passant par les rapports de stage, les mémoires, etc. – restent truffés d’erreurs parfois grossières. On ne peut donc que saluer la clairvoyance de cet étudiant qui définissait la francophonie comme « un ensemble de pays qui ont en commun l’usure de la langue française »…

Ce constat d’usure suscite chez les enseignants des sentiments divers : inquiétude ou colère parfois, résignation ou obstination sûrement. Mais entre ces extrêmes, n’y aurait-il pas d’autres voies à explorer ? Tel est le propos de cet ouvrage, qui rassemble quelques voix autorisées de la recherche et de l’enseignement contemporains en Belgique et en France. et qui constitue les actes du Colloque "L'orthographe française à l'épreuve du supérieur" organisé par l'Institut Libre Marie Haps, le 27 mai 2005

ISBN 2-87463-020-9

Sommaire

Commander

 

Hors-série

 

"Le poids des mots" par G. Purnelle, C. Fairon et A. Dister

La statistique textuelle est une discipline 'transversale' qui intéresse de nombreux secteurs des sciences humaines. On retrouve par exemple dans cet ouvrage des travaux portant sur l'analyse du discours politique, l'analyse littéraire, la lexicométrie, l'analyse stylométrique, la linguistique de corpus, le traitement automatique du langage, etc.

Le poids des mots (vol.1 et 2). Actes des 7es Journées internationales d'Analyse statistique des Données Textuelles édité par Gérald PURNELLE, Cédrick FAIRON et Anne DISTER. Presses universitaires de Louvain, 2004

Vol 1 : ISBN 2-930344-49-0
Vol 2 : ISBN 2-930344-50-4

Commander

Comité scientifique de la Collection Cahiers du CENTAL

Sergio Bolasco Università di Roma « La Sapienza », IT
Laurence Danlos Université Paris 7, FR
Guy Deville Facultés universitaires Notre-Dame de la Paix, BE
Thierry Dutoit Faculté Polytechnique de Mons, BE
Louisette Emirkanian Université du Québec à Montréal, CA
Cédrick Fairon Université catholique de Louvain, BE
Thierry Fontenelle Microsoft Speech & Natural Language Group, USA
Sylviane Granger Université catholique de Louvain, BE
Guy Lapalme Université de Montréal, CA
Eric Laporte Université de Marne-la-Vallée, FR
Denis Maurel Université François-Rabelais de Tours, FR
Damon Mayaffre Université de Nice, Sophia Antipolis, FR
Sébastien Paumier Université de Marne-la-Vallée, FR
Alain Polguère Université de Montréal, CA
Antoinette Renouf University of Central England in Birmingham, UK
Jean Senellart Systran, FR
Anne-Catherine Simon Université catholique de Louvain, BE
Agnès Tutin Université Stendhal, Grenoble 3, FR
Pierre Zweigenbaum CHU Pitié-Salpêtrière, Université Paris 6, FR

Comité de rédaction

Anne Dister CENTAL, Université catholique de Louvain, BE
Cédrick Fairon (directeur) CENTAL, Université catholique de Louvain, BE
Patrick Watrin CENTAL, Université catholique de Louvain, BE

Secrétariat de rédaction

Centre de Traitement Automatique du Langage (CENTAL)
Place Montesquieu, 3 (bte L2.06.04) à 1348 Louvain-la-Neuve (Belgique)
cental@uclouvain.be