Enseignants
Langue
d'enseignement
d'enseignement
Français
> English-friendly
> English-friendly
Préalables
L’accès à ce cours est réservé à des étudiants ayant déjà suivi un cours de programmation.
Thèmes abordés
Quelles sont les données numériques exploitées en sciences humaines (les corpus digitaux, les séries chronologiques, les bases de données, les images numériques, les enregistrements sonores ou vidéos, etc.) et surtout comment automatiser leur dépouillement quand les volumes de données deviennent trop importants ? Au travers de projet de programmation, les étudiants découvrent comment manipuler des données de sciences humaines dans le cadre de différents domaines d’études.
Python est un langage de programmation libre, versatile et bénéficiant d'une communauté d'utilisateurs importante tant dans le domaine universitaire que le secteur privé. Avec la multiplication des données numériques dans les sciences humaines et sociales, le recours à l'informatique devient indispensable pour la collecte, la mise en forme, l'analyse et la visualisation des données.
Dans le contexte des sciences humaines, le langage Python permet aussi bien de collecter des données textuelles/multimodales sur internet ou sur les réseaux sociaux, que d'identifier les réseaux formés par des personnages historiques dans un corpus de lettres, de reconnaître automatiquement la paternité d'une œuvre littéraire au travers de schémas stylistiques, de contraster les sentiments associés à certains concepts dans un corpus médiatique, ou de cartographier les lieux mentionnés dans un corpus issus des réseaux sociaux. Python permet l'application de méthodes d'analyses statistiques aussi bien que des méthodes d'apprentissage automatique et d'Intelligence Artificielle. Il s'agit donc d'un outil flexible dont la maitrise ouvre de nombreuses possibilités.
En plus de développer des compétences informatiques au service de l'automatisation du traitement et de l'analyse de données de sciences humaines, nous réfléchirons aux défis et dilemmes éthiques posés par l'étude computationnelle de la culture.
Python est un langage de programmation libre, versatile et bénéficiant d'une communauté d'utilisateurs importante tant dans le domaine universitaire que le secteur privé. Avec la multiplication des données numériques dans les sciences humaines et sociales, le recours à l'informatique devient indispensable pour la collecte, la mise en forme, l'analyse et la visualisation des données.
Dans le contexte des sciences humaines, le langage Python permet aussi bien de collecter des données textuelles/multimodales sur internet ou sur les réseaux sociaux, que d'identifier les réseaux formés par des personnages historiques dans un corpus de lettres, de reconnaître automatiquement la paternité d'une œuvre littéraire au travers de schémas stylistiques, de contraster les sentiments associés à certains concepts dans un corpus médiatique, ou de cartographier les lieux mentionnés dans un corpus issus des réseaux sociaux. Python permet l'application de méthodes d'analyses statistiques aussi bien que des méthodes d'apprentissage automatique et d'Intelligence Artificielle. Il s'agit donc d'un outil flexible dont la maitrise ouvre de nombreuses possibilités.
En plus de développer des compétences informatiques au service de l'automatisation du traitement et de l'analyse de données de sciences humaines, nous réfléchirons aux défis et dilemmes éthiques posés par l'étude computationnelle de la culture.
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
| 1 | Planifier et développer une séquence d'instructions compréhensibles pour un système informatique afin de résoudre un problème donné ou d'effectuer une tâche spécifique (Programmation, DigiComp 3.4) |
| 2 | Utiliser les outils et les technologies numériques pour créer des connaissances et innover dans les processus et les produits. S'engager individuellement et collectivement dans un traitement cognitif pour comprendre et résoudre des problèmes conceptuels et des situations problématiques dans des environnements numériques. (DigiComp 5.3) |
| Les AA « DigiComp » renvoient au référentiel européen « The Digital Competence Framework for Citizens (DigiComp 2.2) ». | |
Contenu
Ce cours propose une introduction aux usages du langage de programmation Python pour la recherche et l’analyse de données dans le champ des humanités numériques. L’accent est mis sur l’exploration des outils et modules particulièrement adaptés aux problématiques des sciences humaines, tout en développant une réflexion critique sur leurs apports et leurs limites.
Nous travaillons à partir de jeux de données textuelles, issus de la presse contemporaine, des réseaux sociaux, d'oeuvres littéraires ou de documents historiques. À partir de ceux-ci, nous explorons différentes taches d'extraction d'information : conversion de documents scannés en fichiers exploitables (reconnaissance optique de caractères), exploration de réseaux sociaux ou intellectuels, détection automatique de noms de personnes, de lieux, d’événements ou de dates (reconnaissance d’entités nommées), ou identification de tendances linguistiques et sémantiques.
Au-delà de l’apprentissage technique, le cours met l’accent sur l’interprétation des résultats. Nous envisageons la représentativité de nos données, la signification de nos résultats, les questions auxquelles ils nous permettent de répondre et les limitations de leurs interprétations. Nous examinons également la manière dont ces méthodes s'articulent avec des approches qualitatives.
L’objectif est d’outiller les étudiant·e·s non seulement pour utiliser Python dans leurs recherches, mais aussi pour développer une posture réflexive et critique face aux données et à leur interprétation.
Nous travaillons à partir de jeux de données textuelles, issus de la presse contemporaine, des réseaux sociaux, d'oeuvres littéraires ou de documents historiques. À partir de ceux-ci, nous explorons différentes taches d'extraction d'information : conversion de documents scannés en fichiers exploitables (reconnaissance optique de caractères), exploration de réseaux sociaux ou intellectuels, détection automatique de noms de personnes, de lieux, d’événements ou de dates (reconnaissance d’entités nommées), ou identification de tendances linguistiques et sémantiques.
Au-delà de l’apprentissage technique, le cours met l’accent sur l’interprétation des résultats. Nous envisageons la représentativité de nos données, la signification de nos résultats, les questions auxquelles ils nous permettent de répondre et les limitations de leurs interprétations. Nous examinons également la manière dont ces méthodes s'articulent avec des approches qualitatives.
L’objectif est d’outiller les étudiant·e·s non seulement pour utiliser Python dans leurs recherches, mais aussi pour développer une posture réflexive et critique face aux données et à leur interprétation.
Méthodes d'enseignement
Séances magistrales et travaux pratiques.
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
L'évaluation comprend les trois composantes suivantes :
NB : Les intelligences artificielles (IA) génératives doivent être utilisées de manière responsable et conformément aux pratiques de l’intégrité académique et scientifique. L'intégrité scientifique impliquant que l'on cite ses sources, l'usage d'une IA doit toujours être signalé. L'utilisation des intelligences artificielles pour les tâches où celles-ci sont explicitement interdites sera considérée comme un cas de tricherie.
- Travail écrit à rendre à la fin du quadrimestre (50 %).
- Examen oral portant sur le travail écrit pendant la session d'examen (30 %).
- Evaluation continue du travail fourni dans le cadre du cours (20 %).
NB : Les intelligences artificielles (IA) génératives doivent être utilisées de manière responsable et conformément aux pratiques de l’intégrité académique et scientifique. L'intégrité scientifique impliquant que l'on cite ses sources, l'usage d'une IA doit toujours être signalé. L'utilisation des intelligences artificielles pour les tâches où celles-ci sont explicitement interdites sera considérée comme un cas de tricherie.
Ressources
en ligne
en ligne
Moodle
Faculté ou entité
en charge
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en communication multilingue
Master [120] en sciences et technologies de l'information et de la communication
Master [120] en histoire de l'art et archéologie, orientation musicologie
Master [120] en traduction
Master [120] en interprétation
Master [120] en histoire
Master [120] en linguistique
Master de spécialisation en cultures visuelles
Master [120] en éthique
Master [120] en philosophie
Master [120] en langues et lettres modernes, orientation germaniques
Master [60] en histoire de l'art et archéologie, orientation générale
Master [60] en histoire de l'art et archéologie, orientation musicologie
Master [120] en langues et lettres modernes, orientation générale
Master [120] en langues et lettres anciennes et modernes [Master [120] en langues et lettres anciennes et modernes]
Master [120] en langues et lettres françaises et romanes, orientation français langue étrangère [Master [120] en langues et lettres françaises et romanes, orientation français langue étrangère]