English: Corpus-assisted discourse studies

5.00 crédits

30.0 h

Enseignants

Vincent Arnaud;

Langue
d'enseignement

Anglais

Préalables

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.

Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :
- Comprendre la place qu’occupe les CADS dans le paysage des Digital Humanities et du Big Data ; - Situer les CADS par rapport aux autres approches et méthodes d’analyse textuelle assistée par ordinateur et traitement du langage (par ex : text mining, sentiment analysis, Critical Discourse Analysis (CDA), culturomics, et corpus linguistics) ; - Identifier les forces et faiblesses des différentes méthodes et approches mentionnées ci-dessus ; - Lire, décrire et évaluer de manière critique des articles scientifiques relevant des domaines de l’analyse du discours, de la Critical Discourse Analysis (CDA), et des Corpus-Assisted Discourse Studies (CADS) ; - Maîtriser les principes de base du raisonnement quantitatif et de la recherche scientifique ; - Rendre compte de données quantitatives selon les règles de l’art ; - Utiliser des corpus « prêts à l’emploi » et construire des corpus plus spécialisés ; - Réaliser des analyses de concordances, de collocations/ réseaux de collocations, de dispersion et de « keywords » ; - Extraire des « keywords », N-grams et « key » N-grams dans un objectif de détection de plagiat et d’identification d’idiolectes ; - Développer une question de recherche spécifique et faire un choix éclairé et pertinent d’outils, de méthodes et de concepts théoriques au service de cette question de recherche ; - Rendre compte (de manière écrite et orale) de cette question recherche de manière critique, ainsi que des méthodes employées et résultats obtenus ; - Identifier les forces et les faiblesses du projet de recherche.

Contenu

Le cours s’articulera autour de sessions théoriques, de sessions pratiques, et d’activités en classe inversée.

Le cours se divisera en 8 chapitres :

Chapitre 1 : Mise en contexte (objectif : situer les CADS dans le paysage du Big Data, Digital Humanities et Text Mining)
Chapitre 2 : Collocations
Chapitre 3 : Fréquence et dispersion
Chapitre 4 : Concordances
Chapter 5 : N-Grams et détection de plagiat
Chapter 6 : keywords
Chapter 7 : Key N-Grams
Chapter 8 : Conclusion

Méthodes d'enseignement

Cours magistraux, sessions pratiques, classe inversée, études de cas et activités de groupe, discussions, questionnaires interactifs;

Modes d'évaluation
des acquis des étudiants

Evaluation formative :
Les activités et exercices divers organisés durant les séances de cours devraient permettre à l'étudiant d'évaluer ses progrès.

Evaluation certificative :
Le cours sera évalué sur base des éléments suivants :
Activités pratiques en classe : 30% (les activités comptant pour ces 30% seront clairement annoncées comme certificatives)
Projet de recherche (term paper) et présentation : 70%

Autres infos

Utilisation des intelligences artificielles génératives (ou tout autre outil en ligne, comme par. ex. des traducteurs, des outils de vérification de l’orthographe et de la grammaire, …)
Si l’étudiant.e choisit d’utiliser une ou plusieurs IA (ou tout autre outil en ligne), il ou elle est tenu.e d’indiquer systématiquement toutes les parties ayant fait l’objet de cette utilisation, par ex. en notes de bas de page. L'étudiant.e précisera si l’IA a été utilisée pour rechercher de l’information, pour la rédaction du texte ou pour l’amélioration ou la correction de celui-ci. Par ailleurs, l'étudiant.e mentionnera quelle IA a été utilisée (ChatGPT, Bing, Bard, Chatsonic...) et la date à laquelle il ou elle en a fait usage. Ces sources d’information seront systématiquement citées dans le respect des normes de référencement bibliographique indiquées par le ou la titulaire du cours. L’étudiant.e reste par ailleurs responsable du contenu de sa production, indépendamment des sources utilisées.
Afin d’assurer que la production écrite de l’étudiant.e est personnelle, des critères tels que l’originalité, l’esprit critique, la créativité et l’illustration par des exemples (par ex. issus de sa propre expérience) seront pris en compte.
Tout comportement, de la part de l'étudiant.e, qui empêche ou tente d'empêcher, en tout ou en partie, une évaluation correcte de ses connaissances, aptitudes et/ou compétences sera considéré comme une irrégularité qui pourrait entrainer des sanctions.

Ressources
en ligne

Companion website

Bibliographie

Les présentations ppt, les exercices, les articles scientifiques et les autres supports de cours seront mis à disposition sur le site du cours.
Angier, N. 2007. The Canon: A Whirligig Tour of the Beautiful Basics of Science. New York: First Mariner.
Baker, P. 2023. Using Corpora in Discourse Analysis. (2nd edition). London: Bloomsbury.
Brezina, V. 2018. Statistics in Corpus Linguistics: A practical Guide. Cambridge: Cambridge University Press.
Brezina, V., Platt, W. 2023. #LancsBox X 2.0 [software package], lancsbox.lancaster.ac.uk
Heritage, F. and Taylor, C. (eds.). 2024. Analysing Representation: A Corpus and Discourse Textbook. New York: Routledge.
McEnery, T. Xiao, R. and Yukio, T. 2006. Corpus-based Language Studies: An Advanced Resource Book. New York: Routledge.
Paquot, M. and Gries, S. (eds.) 2020. A Practical Handbook of Corpus Linguistics. Cham: Springer.
Vincent, A. 2020. The Religious Rhetoric of U.S. Presidential Candidates: A Corpus Linguistics Approach to the Rhetorical God Gap. New York: Routledge.

Faculté ou entité
en charge

PHLB

Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme

Sigle

Crédits

Prérequis

Acquis
d'apprentissage

Bachelier en langues et lettres modernes, orientation germaniques

GERB1BA

BGERM1140

Bachelier en langues et lettres modernes, orientation générale

ROGB1BA

BGERM1140