Vous pourrez découvrir ci-dessous quelques projets importants menés au sein du Pôle de recherche en linguistique au cours de ces dernières années. Nous vous invitons à consulter les pages des différents centres et plateformes pour une liste plus exhaustive.
Nos projets :
AMesure
Centre impliqué : CENTAL
AMesure est une plateforme Web conçue pour aider les rédacteurs de texte administratifs à écrire le plus lisiblement possible. Elle s'articule autour de trois objectifs :
- Fournir un score évaluant la difficulté de lecture globale d'un texte ;
- Identifier, dans un texte, les caractéristiques linguistiques qui influencent négativement la compréhension du texte (mots difficiles ou spécialisés, structures syntaxiques complexes, utilisation abuse d'abréviations, etc.) ;
- Prodiguer des conseils de rédaction simple en relation avec les phénomènes détectés lors de l'étape 2. Pour ce faire, nous nous basons sur les recommandations présentes dans les guides de rédaction simple.
Accédez à la page du projet ici : AMesure
ArchiBald
Centre impliqué : CENTAL
ArchiBald : ARCHIves Breeding by Automated Language Description
À ce jour, malgré la numérisation des supports, l'exploitation des contenus audiovisuels des fonds d'archive de Sonuma S.A. (constitués des archives de la RTBF et de plusieurs télévisions locales) est fortement ralentie par la phase de description documentaire. Seuls 25% de ces fonds ont des métadonnées qui permettent une valorisation optimale.
Le projet Archibald a pour objectif principal d'accélérer la mise à disposition des archives et, par conséquent, d'intensifier leur utilisation et leur valorisation en proposant, d'une part, une plateforme d'indexation des contenus audiovisuels (émissions radio et télé) et textuels (descriptifs, supports écrits des journalistes...) et, d'autre part, une interface de recherche plein texte et un ensemble d'outils sémantiques de navigation.
Cet objectif suppose la résolution de deux problèmes :
- La segmentation des fichiers. Chaque émission est stockée de manière monolithique et n'offre aucun moyen de navigation efficace au sein des différentes séquences qui la composent. Ainsi, par exemple, il n'est pas possible de sélectionner un sujet d'un journal télévisé sans parcourir la totalité du fichier vidéo.
- L'enrichissement des métadonnées. Parce qu'elles ne prennent pas en compte le contenu des séquences audio et vidéo, les informations actuellement associées aux différents fichiers ne donnent qu'un aperçu très partiel des sujets traités.
Par conséquent, pour assurer la valorisation effective des contenus, chaque fichier doit être transformé et enrichi de manière à ce que les unités résultantes, les documents, puissent être retrouvés efficacement avec un degré de granularité suffisant.
Assessing Content and Language Integrated Learning (CLIL) / Evaluation de l’Enseignement d’une Matière par Intégration d’une Langue Etrangère (EMILE)
Centres impliqués : VALIBEL/CECL
En ces temps de mondialisation, les politiques favorisent de plus en plus le multilinguisme en tant que fort atout social et économique. L’enseignement d’une matière par l’intégration d’une langue étrangère (EMILE), une méthode didactique dans laquelle les matières scolaires sont enseignées dans une langue cible différente de celle de la langue de l'enseignement général – couramment appelée enseignement en immersion, est vu comme un moyen de promouvoir le multilinguisme dans l'enseignement. Dans la Communauté française de Belgique, les écoles ont été autorisées à dispenser l'EMILE en néerlandais, en anglais ou en allemand depuis 1998. A ce jour, nous ne disposons cependant que d'une vision fragmentaire et incomplète de l’impact de l'EMILE sur l'acquisition d'une langue seconde/étrangère.
Sur la base d'une étude longitudinale à grande échelle, ce projet de recherche vise à mieux comprendre les aspects linguistiques, cognitifs et éducationnels de l'EMILE et à comprendre comment l'interaction entre ces trois perspectives peut sous-tendre les processus d'acquisition de L2. A cette fin, le projet se concentre sur les apprenants francophones en CLIL et non-CLIL (groupe contrôle) ayant le néerlandais ou l'anglais comme langue cible. Les données sont collectées à différents moments au cours des deux dernières années de l'enseignement primaire et secondaire. Cette étude interdisciplinaire vise à apporter une forte contribution empirique et théorique aux débats scientifiques internationaux en cours sur le multilinguisme en général et sur l'EMILE en particulier.
CEFRLex
Centre impliqué : CENTAL
Le projet CEFRLex est un projet collaboratif international visant à proposer, pour chacune des principales langues européennes, un lexique pédagogique décrivant la distribution de fréquence des mots sur les niveaux du Cadre européen commun de référence pour les langues (CECR). Les fréquences rapportées dans chaque ressource ont été estimées sur des corpus de texte issus de manuels pédagogiques ou de livres simplifiés. Il s'agit donc de matériaux auxquels sont réellement confrontés les apprenants d'une langue étrangère. Les fréquences ont ensuite été normalisées selon une procédure décrite dans François et al. (2014). Ce type de ressources ouvre de nombreuses perspectives tant du point de vue pédagogique que de la recherche.
Accédez à la page du projet ici : CEFRLex
Digitalising mobility and international networks with open education (DIONE)
Centres impliqués : VALIBEL/TeAMM
The project DIONE addresses two issues that are on the agenda in the current situation with corona-conditioned low mobility and international cooperation: The digitalisation of university teaching and the development of alternative internationalisation formats. In a nutshell, we are developing short-term virtual teaching cooperation formats aimed at acquiring a wide range of digital competences.
Discourse, populism and democracy – Tracking the uses of populism in media and political discourse (TrUMPo)
Centres impliqués : VALIBEL/LASCO/CESPOL
In contemporary democracies, there is not a day without the word populism being used in political and media discourse. For many observers worldwide, the spread of populism is one of the main threats to democracy. This has led to the development of a booming literature on populist political parties and politicians. Nevertheless, one major aspect of populism remains understudied, namely the use of the term populist itself by political and other actors, which is the subject of a real political struggle. Populism is indeed used by some political actors to disqualify political opponents but also as a positive category/label demonstrating proximity to people’s concerns in order to gain legitimacy. These uses of populism lead to fierce debates about the role and place of the people in democracies, and about who can pretend to best represent the people since the way the word and the notion of populism are defined, used and circulated is directly related to competing conceptions of democracy.
In order to understand how the construction of this category of populism contributes to shaping our collective imagination of democracy, TrUMPo seeks to understand in which contexts and situations this notion is used, which meaning it conveys in actual discursive practices, and how it circulates in the public debate. As a result, the topic will be studied from a threefold perspective: political science, communication studies and linguistics. Since TrUMPo’s aim is to understand how discourse about populism plays a crucial role in the mediatized political debate in European democracies, the project will compare these discourses in the four domestic contexts – French- and Dutch-speaking Belgium, France and Spain. Project data will come from the parliamentary arena as well as mass and social media. The data will be analyzed through qualitative and quantitative methods.
The multidisciplinary project is carried out under the supervision of Prof. Min Reuchamps (ISPOLE) as coordinator together with Prof. Barbara De Cock (ILC-PLIN), Prof. Philippe Hambye (ILC-PLIN) and Prof. Sandrine Roginsky (ILC-PCOM). Further project collaborators from PLIN are Nadezda Schinova, Raül Nuevo Gascó and Romane Werner.
Fluency and disfluency markers. A multimodal contrastive perspective (2012-2017)
Centres impliqués : VALIBEL/CECL
Les objectifs de la recherche menée dans le cadre de ce projet ARC étaient à la fois théoriques, méthodologiques et descriptifs. L’objet d’étude concernait les marqueurs de fluence et de disfluence en différentes langues et modalités étudiées de manière contrastive, à savoir le discours oral en anglais et en français, le discours d’apprenants de l’anglais, et le discours en langue des signes de Belgique francophone (LSFB). L’hypothèse centrale du projet était qu’il n’y a pas de marqueurs spécifiques de la fluence et de la disfluence, mais que les mêmes marques linguistiques seront tantôt des indices de fluence, tantôt des indices de disfluence en fonction du contexte d’énonciation, du genre discursif, des langues, et des locuteurs.
La recherche s'est articulée autour de quatre thèses:
- Ludivine Crible (co-promotrices: Liesbeth Degand & Gaëtanelle Gilquin): Discourse Markers and (Dis)Fluency across Genres : A Contrastive Usage-Based Study in English and French (Thèse défendue le 14 février 2017)
- Ingrid Notarrigo (co-promotrices: Laurence Meurant & Anne Catherine Simon): Les marqueurs de (dis)fluence en langue des signes de Belgique francophone (LSFB) (Thèse défendue le 31 août 2017)
- Amandine Dumont (co-promotrices: Sylviane Granger & Gaëtanelle Gilquin): Fluency and Disfluency: A Corpus Study of Nonnative and Native Speaker (Dis)fluency Profiles (Thèse défendue le 22 mai 2018)
- Iulia Grosman (co-promotrices: Anne Catherine Simon & Liesbeth Degand): Evaluation contextuelle de la (dis)uence en production et perception. Pratiques communicatives et formes prosodico-syntaxiques en français (Défense prévue décembre 2018)
Tant au niveau théorique que méthodologique, les objectifs initiaux de la recherche ont été atteints. Au niveau théorique, l’avancée principale concerne la définition ambivalente, contextuelle, des notions mêmes de fluence et disfluence, développées en détail dans chacune des quatre thèses de doctorats. Au niveau méthodologique, le travail sur corpus, dont un noyau comparable dans les quatre langues et modalités, a permis des avancées notables tant en conception de corpus comparables, en annotation des données empiriques, et en combinaison de la recherche expérimentale avec la recherche sur corpus. A côté des quatre thèses de doctorats réalisées au sein du projet ARC, trois autres thèses se sont greffées sur la recherche en cours (George Christodoulides (promotrice : Anne Catherine Simon) : « Effects of Cognitive Load on Speech Production and Perception », défendue en septembre 2016 ; Silvia Gabarró Lopez (promotrice : Laurence Meurant) : « Discourse Markers in French Belgian Sign Language (LSFB) and Catalan Sign Language (LSC) : Buoys, Palm-Up and Same. Variation, functions and position in discourse » (défendue en septembre 2017) ; Maïté Dupont (co-promotrices : Liesbeth Degand & Sylviane Granger) : « A systemic functional corpus-based analysis of contrastive connectives in English and French », défense prévue en 2018), et sept mémoires de master.
ICLE
Centre impliqué : CECL
Le corpus 'International Corpus of Learner English' se compose de textes argumentatifs rédigés par des apprenants de l'anglais de niveaux intermédiaire-avancé à avancé, et de langues maternelles diverses. Le corpus est le fruit d'une collaboration avec de nombreuses universités partenaires à travers le monde. Grâce à l'adoption, par tous les partenaires, de critères de collecte de données communs, il se caractérise par une grande homogénéité.
La première version du corpus est parue en format CD-ROM en 2002, et a été suivie d'une version augmentée - ICLEv2 - en 2009. Nous préparons actuellement une version web du corpus, ICLEv3. Cette troisième version comprendra environ 5 millions de mots, provenant de textes écrits par des apprenants issus de 26 populations langagières différentes (allemand, bulgare, chinois, coréen, espagnol, finnois, français, grec, hongrois, italien, japonais, lituanien, macédonien, néerlandais, norvégien, perse, polonais, portugais brésilien, punjabi, russe, serbe, suédois, tchèque, tswana, turc, ourdou).
Le corpus ICLE a été largement utilisé dans les domaines de l'apprentissage, de l'évaluation et du traitement automatique des langues, à des fins de recherche aussi bien théoriques qu'appliquées.
- Granger S. (2003). The International Corpus of Learner English. A new resource for foreign language learning and teaching and second language acquisition research. TESOL Quartely 37(3), pp. 538-546.
- Granger, S., Dagneaux, E., Meunier, F., Paquot, M. (2009). The International Corpus of Learner English. Handbook and CD-ROM. Version 2. Louvain-la-Neuve : Presses universitaires de Louvain.
Le Petit Bon Usage
Centres impliqués : CENTAL/VALIBEL
Grammaire complète et accessible, Le Petit Bon Usage vous fera entrer dans la langue française grâce à ses nombreuses citations tirées d'oeuvres d'écrivains, de poètes et de chanteurs classiques ou contemporains. Avec :
- Les règles principales et les variantes les plus courantes
- Des centaines de citations littéraires en exemples
- Un index des notions
- Un index des auteurs cités
(Re)découvrez la grammaire française en passant par Victor Hugo et Amélie Nothomb, Albert Camus, Bernard Weber et Marc Lévy, avec des incursions chez Brassens, Stromae ou Goscinny et bien d'autres...
Le Petit Bon Usage est une nouveauté qui va séduire une vaste cible, car c'est :
- Une grammaire de référence pour trouver une réponse simple à toutes les questions.
- Une grammaire illustrée par les citations de plus de 300 auteurs et chanteurs
- Avec :
- Une maquette en 2 couleurs pour repérer les points importants
- Le tableau des conjugaisons
- La nouvelle orthographe : rappel des règles
- La féminisation des noms de métiers, fonctions, grades ou titres
- Un index grammatical complet
- Un index de 300 auteurs cités
Quelques articles de presse :
- Le Figaro : "A quoi sert la grammaire?"
- Le Soir : "Le français, s'est comme même pas compliquer"
- La Libre : "La grammaire 'reliftée' du bon père Grevisse"
LEAD
Centre impliqué : CECL
Le Louvain EAP dictionnary (LEAD) est un dictionnaire web d'anglais scientifique destiné aux non-anglophones (Granger and Paquot, 2015). Il contient une description détaillée basée sur un corpus d'approximativement 1000 mots et expressions appartenant au vocabulaire scientifique général. Ces mots expriment des fonctions clés telles que le contraste, l'exemplification ou la relation cause-effet. La caractéristique principale du dictionnaire LEAD est l'attention qu'il porte à la phraséologie (collocations et segments répétés).
Le contenu des entrées lexicales repose sur l'analyse d'un large corpus de textes scientifiques (le sous-corpus scientifique du Bristish National Corpus), de plusieurs corpus spécifiques représentant des disciplines différentes et de corpus d'anglais langue étrangère représentant des apprenants de nombreuses langues maternelles.
L'originalité principale de LEAD réside dans ses possibilités de personnalisation : une partie du contenu s'adapte automatiquement en fonction de la discipline et de la langue maternelle de l'utilisateur.
Une autre caractéristique importante de LEAD est que, grâce à son format électronique, il offre plusieurs possibilités d'accès. Il peut être utilisé en tant que dictionnaire sémasiologique (du lexème au sens) et onomasiologique (du sens/concept au lexème) grâce à une liste des fonctions rhétoriques ou organisationnelles propres au discours académique. C'est également un dictionnaire semi-bilingue étant donné que les utilisateurs qui ont indiqué une langue maternelle donnée peuvent rechercher les mots anglais du dictionnaire à partir de la traduction de ces mots correspondants dans leur langue maternelle.
Le dictionnaire LEAD est un outil intégré : les entrées du dictionnaire sont reliées à d'autres ressources (en particulier, un concordancier, des corpus de spécialité, des exercices et une interface de rétroaction corrective).
Une version bêta du dictionnaire est en accès livre à l'adresse suivante : https://leaddico.uclouvain.be
- Granger, S. & Paquot, M. (2015). Electronic lexicography goes local. Design and structures of a needs-driven online academic writing aid. Lexicographica 31.
LONGDALE
Centre impliqué : CECL
Directrice du projet : Prof. Fanny Meunier
Le projet LONGDALE (Longitudinal Databse of Learner English) a été lancé en janvier 2008 et vise à alimenter une large base de données longitudinales reprenant, entre autre, des productions d'apprenants de diverses langues maternelles. Dans le cadre de ce projet, nous suivons des apprenants pendant au moins 3 ans et récoltons divers types de données allant de données (semi-)authentiques - telles que des productions orales ou écrites - à des données beaucoup plus guidées, voire expérimentales telles que des tests de jugement ou de grammaticalité.
La base de données inclut également les profils détaillés des apprenants, incluant des variables telles que genre, âge, profil éducatif, niveau de compétence langagière, mais aussi des variable liées à la tâche.
Cinq équipes internationales ont déjà collecté une série de données et de nouvelles collectes sont prévues dans un futur proche.
- de Haan, Pieter / van der Haagen, Monique 2014. A Longitudinal Study of the Syntactic Development of Very Advanced Dutch EFL Writing. In Vandelanotte, Lieven / Davidse, Kristin / Gentens, Caroline / Kimps, Ditte (eds) Recent Advances in Corpus Linguistics Developing and Exploiting Corpora. Amsterdam/New York: Rodopi, 335–349.
- Gentil, Guillaume / Meunier, Fanny (in press) A systemic functional linguistic approach to usage-based research and instruction: The case of nominalization in L2 academic writing. In Tyler, A. / Ortega, L. / Uno, M. / Park, H. I. (eds.). Usage-inspired L2 instruction: Researched pedagogy. Amsterdam: John Benjamins.
- Goutéraux, Pascale 2013. Learners of English and Conversational Proficiency. In Granger, Sylviane / Gilquin, Gaëtanelle / Meunier, Fanny (eds) Twenty Years of Learner Corpus Research: Looking Back, Moving Ahead. Louvain-la-Neuve: Presses universitaires de Louvain, 197–210.
- Littré, Damien 2015. Combining Experimental Data and Corpus Data: Intermediate French-speaking Learners and the English Present. Corpus Linguistics and Linguistic Theory 11/1, 89–126.
- Meunier, Fanny 2016. Introduction to the LONGDALE Project. In Castello, Erik / Ackerley, Katherine / Coccetta, Francesca (eds) Studies in Learner Corpus Linguistics. Research and Applications for Foreign Language Teaching and Assessment. Berlin: Peter Lang, 123-126.
- Meunier, Fanny / Littré, Damien 2013. Tracking Learners’ Progress. Adopting a Dual ‘Corpus Cum Experimental Data’ Approach. The Modern Language Journal 97/1, 61–76.
- van Vuuren, Sanne 2013. ‘Information Structural Transfer in Advanced Dutch EFL Writing: A Cross-linguistic Longitudinal Study’, in Aalberse, S. and Auer, A. (eds) Linguistics in the Netherlands 2011, Amsterdam: Benjamins, 173–87.
MUST
Centre impliqué : CECL
Situé à la croisée de la traductologie, de la linguistique contrastive et de l'enseignement de la traduction et des langues étrangères, le projet MUST (Multilingual Student Translation) a pour objectif de collecter un corpus multilingue de traductions d'apprenants à l'aide d'outils et de méthodes standardisés.
MUST inclut à la fois des traductions vers la langue maternelle (L2>L1) et vers la langue étrangère (L1<L2). Il comprend une grande variété de registres, genres, et types de textes. Tous les textes du corpus sont accompagnés de nombreuses métadonnées standardisées qui ont trait au texte source, à la tâche de traduction et à l'apprenant. De plus, les traductions des étudiants peuvent être annotées à l'aide d'un système d'annotation tout à fait novateur, appelé TAS (Translation-oriented Annotation System).
À ce jour, 31 équipes de recherche, originaires de 14 pays différents, ont rejoint le projet. MUST couvre ainsi 16 langues : l'allemand, l'anglais, le chinois, l'espagnol, le français, le galicien, le grec, l'italien, le lithuanien, le macédonien, le néerlandais, le norvégien, le polonais, le portugais, le russe et le slovène. Les partenaires du projet rassemblent et interrogent les données MUST via l'outil web Hypal4MUST, une nouvelle version de Hypal, le programme d'alignement de textes parallèles développé par Adam Obrusník.
TextLink: Structuring Discourse in multilingual Europe (IS1312)
Centre impliqué : VALIBEL
The main objective of the COST Action is to coordinate the creation of a European portal of cross-linguistically available monolingual or parallel corpora that have been enriched and made interoperable and co-searchable through annotation of discourse-relational devices and the information they convey.
Accédez au site web TextLink : TextLink