Analyse des données numériques

mcomu1203  2018-2019  Mons

Analyse des données numériques
5 crédits
30.0 h + 10.0 h
Q2
Enseignants
Fouss François; Francq Pascal;
Langue
d'enseignement
Français
Préalables
/
Thèmes abordés
L'objectif de cet enseignement est d'initier les étudiants à la collecte, au nettoyage et à l'analyse des données du web. Le cours abordera les éléments suivants :
  • Une introduction, pour rappeler la nécessité de comprendre et donner du sens aux données issues du web
  • Les explications sur les différents types de données qu'on trouve sur le web, en incluant les métadonnées, et une sensibilisation aux différentes manières de les extraires.
  • Introduire ici les notions de code et sensibiliser aux différents langages existants.
  • Le cours introduira ensuite deux types d'analyses de données :
  • L'analyse lexicométrique en lien avec la linguistique
  • L'analyse des graphes en lien avec la théorie des réseaux sociaux
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1

Au terme de cet enseignement, l¿étudiant sera capable :

  • De comprendre la structures des données numériques
  • De comprendre les grandes étapes de collecte, de nettoyage et d¿exploitation des données
  • De réaliser une analyse lexicométrique et une analyse de graphes de base
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
Ce cours a pour objectif d’apprendre à appliquer une méthodologie adéquate d'analyse de données numériques issues du web, et d'apprendre à maîtriser les techniques et modèles ad-hoc, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont:
  • Recherche d’information sur le Web
    • Concepts de base (indexation, de compression, de recherche, de classification et de catégorisation)
    • Modèles de recherche d’information
  • Ingénierie du Web
    • Référencement
    • Collecter, nettoyer et analyser les données issues du Web
    • Outils d’analyse d’audience de sites Web
  • Link Analysis : recommander/analyser du contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • Identification des nœuds maximisant la diffusion d’information dans le réseau
      • etc.
Méthodes d'enseignement
  • Exposés magistraux
  • Exercices intégrés au cours
  • Projet par groupe
Modes d'évaluation
des acquis des étudiants
    Examen oral et défense de projet
    Bibliographie
    • MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
    • LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
    • FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
    • AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
    • MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
    • MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
    Faculté ou entité
    en charge
    COMU


    Programmes / formations proposant cette unité d'enseignement (UE)

    Intitulé du programme
    Sigle
    Crédits
    Prérequis
    Acquis
    d'apprentissage
    Bachelier en information et communication