Analyse des données numériques

MCOMU1311  2019-2020  Mons

Analyse des données numériques
5.0 crédits
30.0 h + 10.0 h
2q

Langue
d'enseignement
Français
Préalables

/

Thèmes abordés

L'objectif de cet enseignement est d'initier les étudiants à la collecte, au nettoyage et à l'analyse des données du web. Le cours abordera les éléments suivants :

  • Une introduction, pour rappeler la nécessité de comprendre et donner du sens aux données issues du web
  • Les explications sur les différents types de données qu'on trouve sur le web, en incluant les métadonnées, et une sensibilisation aux différentes manières de les extraires.
  • Introduire ici les notions de code et sensibiliser aux différents langages existants.
  • Le cours introduira ensuite deux types d'analyses de données :
  • L'analyse lexicométrique en lien avec la linguistique
  • L'analyse des graphes en lien avec la théorie des réseaux sociaux
Acquis
d'apprentissage

  • 1
    • De comprendre la structures des données numériques
    • De comprendre les grandes étapes de collecte, de nettoyage et d¿exploitation des données
    • De réaliser une analyse lexicométrique et une analyse de graphes de base

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».

Contenu

Ce cours a pour objectif d’apprendre à appliquer une méthodologie adéquate d'analyse de données numériques issues du web, et d'apprendre à maîtriser les techniques et modèles ad-hoc, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.

Les thèmes principaux de ce cours sont:

  • Recherche d’information sur le Web
    • Concepts de base (indexation, de compression, de recherche, de classification et de catégorisation)
    • Modèles de recherche d’information
  • Ingénierie du Web
    • Référencement
    • Collecter, nettoyer et analyser les données issues du Web
    • Outils d’analyse d’audience de sites Web
  • Link Analysis : recommander/analyser du contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • etc.
Méthodes d'enseignement
  • Exposés magistraux
  • Exercices intégrés au cours
  • Projet par groupe
Modes d'évaluation
des acquis des étudiants

L’évaluation (unique) a une composante pratique et une composante théorique:

  • Evaluation continue (travaux pratiques cotés);
  • Réalisation d'un projet de groupe;
  • Défense du projet et examen oral.

!!! La note obtenue est unique et ne peut donc pas être améliorée durant l'année académique en cours !!!

Bibliographie
  • MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
  • LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
  • FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
  • AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
  • MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
  • MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en information et communication
5
-

Bachelier en sciences humaines et sociales
5
-