English: Corpus-assisted discourse studies

bgerm1354  2023-2024  Bruxelles Saint-Louis

English: Corpus-assisted discourse studies
5.00 crédits
30.0 h
Q2
Enseignants
Vincent Arnaud;
Langue
d'enseignement
Anglais
Préalables

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

- Comprendre la place qu’occupe les CADS dans le paysage des Digital Humanities et du Big Data ;
- Situer les CADS par rapport aux autres approches et méthodes d’analyse textuelle assistée par ordinateur et traitement du langage (par ex : text mining, sentiment analysis, Critical Discourse Analysis (CDA), culturomics, et corpus linguistics) ;
- Identifier les forces et faiblesses des différentes méthodes et approches mentionnées ci-dessus ;
- Lire, décrire et évaluer de manière critique des articles scientifiques relevant des domaines de l’analyse du discours, de la Critical Discourse Analysis (CDA), et des Corpus-Assisted Discourse Studies (CADS) ;
- Maîtriser les principes de base du raisonnement quantitatif et de la recherche scientifique ;
- Rendre compte de données quantitatives selon les règles de l’art ;
- Utiliser des corpus « prêts à l’emploi » et construire des corpus plus spécialisés ;
- Réaliser des analyses de concordances, de collocations/ réseaux de collocations, de dispersion et de « keywords » ;
- Extraire des « keywords », N-grams et « key » N-grams dans un objectif de détection de plagiat et d’identification d’idiolectes ;
- Développer une question de recherche spécifique et faire un choix éclairé et pertinent d’outils, de méthodes et de concepts théoriques au service de cette question de recherche ;
- Rendre compte (de manière écrite et orale) de cette question recherche de manière critique, ainsi que des méthodes employées et résultats obtenus ;
- Identifier les forces et les faiblesses du projet de recherche.
 
Contenu
Le cours s’articulera autour de sessions théoriques, de sessions pratiques, et d’activités en classe inversée.

Le cours se divisera en 8 chapitres :

Chapitre 1 : Mise en contexte (objectif : situer les CADS dans le paysage du Big Data, Digital Humanities et Text Mining)
Chapitre 2 : Collocations
Chapitre 3 : Fréquence et dispersion
Chapitre 4 : Concordances
Chapter 5 : N-Grams et détection de plagiat
Chapter 6 : keywords
Chapter 7 : Key N-Grams
Chapter 8 : Conclusion
Méthodes d'enseignement
Cours magistraux, sessions pratiques, classe inversée, études de cas et activités de groupe, discussions, questionnaires interactifs;
Modes d'évaluation
des acquis des étudiants
Evaluation formative :
Les activités et exercices divers organisés durant les séances de cours devraient permettre à l'étudiant d'évaluer ses progrès.

Evaluation certificative :
Le cours sera évalué sur base des éléments suivants :
Activités pratiques en classe : 30% (les activités comptant pour ces 30% seront clairement annoncées comme certificatives)
Projet de recherche (term paper) et présentation : 70%
 
Autres infos
Utilisation des intelligences artificielles génératives (ou tout autre outil en ligne, comme par. ex. des traducteurs, des outils de vérification de l’orthographe et de la grammaire, …)
Si l’étudiant.e choisit d’utiliser une ou plusieurs IA (ou tout autre outil en ligne), il ou elle est tenu.e d’indiquer systématiquement toutes les parties ayant fait l’objet de cette utilisation, par ex. en notes de bas de page. L'étudiant.e précisera si l’IA a été utilisée pour rechercher de l’information, pour la rédaction du texte ou pour l’amélioration ou la correction de celui-ci. Par ailleurs, l'étudiant.e mentionnera quelle IA a été utilisée (ChatGPT, Bing, Bard, Chatsonic...) et la date à laquelle il ou elle en a fait usage. Ces sources d’information seront systématiquement citées dans le respect des normes de référencement bibliographique indiquées par le ou la titulaire du cours. L’étudiant.e reste par ailleurs responsable du contenu de sa production, indépendamment des sources utilisées. 
Afin d’assurer que la production écrite de l’étudiant.e est personnelle, des critères tels que l’originalité, l’esprit critique, la créativité et l’illustration par des exemples (par ex. issus de sa propre expérience) seront pris en compte. 
Tout comportement, de la part de l'étudiant.e, qui empêche ou tente d'empêcher, en tout ou en partie, une évaluation correcte de ses connaissances, aptitudes et/ou compétences sera considéré comme une irrégularité qui pourrait entrainer des sanctions.
Bibliographie
Les présentations ppt, les exercices, les articles scientifiques et les autres supports de cours seront mis à disposition sur le site du cours.
Angier, N. 2007. The Canon: A Whirligig Tour of the Beautiful Basics of Science. New York: First Mariner.
Baker, P. 2006. Using Corpora in Discourse Analysis. London: Continuum.
Brezina, V. 2018. Statistics in Corpus Linguistics: A practical Guide. Cambridge: Cambridge University Press.
Brezina, V., Platt, W. 2023. #LancsBox X 2.0 [software package], lancsbox.lancaster.ac.uk
McEnery, T. Xiao, R. and Yukio, T. 2006. Corpus-based Language Studies: An Advanced Resource Book. New York: Routledge.
Paquot, M. and Gries, S. (eds.) 2020. A Practical Handbook of Corpus Linguistics. Cham: Springer.
Vincent, A. 2020. The Religious Rhetoric of U.S. Presidential Candidates: A Corpus Linguistics Approach to the Rhetorical God Gap. New York: Routledge.
Faculté ou entité
en charge
PHLB


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en langues et lettres modernes, orientation germaniques

Bachelier en langues et lettres modernes, orientation générale