Web Mining

mlsmm2153  2022-2023  Mons

Web Mining
5.00 crédits
30.0 h
Q1
Enseignants
Fouss François; Vande Kerckhove Corentin (supplée Fouss François);
Langue
d'enseignement
Français
Thèmes abordés
Le Web Mining est l’application de techniques et modèles permettant de rechercher, récolter, nettoyer, analyser, classer et recommander des informations/données issues du Web. Ces techniques sont notamment utilisées dans les moteurs de recherche, qui jouent un rôle central dans la société de l’information connectée, ainsi que les réseaux sociaux. Ce cours a pour objectif d’apprendre à maîtriser ces techniques et modèles, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont :
  • Recherche d’information sur le Web
    • Concepts de base
    • Collecter, nettoyer et analyser les données issues du Web
  • Text Mining: Analyse de données textuelles issues du Web
    • Eléments fondamentaux de l'analyse de textes (corpus, bag of words, etc.)
    • Extraction de termes et représentation de documents (word embedding)
    • Catégorisation de documents
    • Analyse
  • Link Analysis : Analyse de contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe, des données issues du Web
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • etc.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Les Acquis d’Apprentissage (AA) au terme de l’unité d’enseignement
A la fin du cours l'étudiant sera capable de :
  • Comprendre le fonctionnement des principaux outils d’extraction de données issues du Web ;
  • Comprendre le fonctionnement des principaux algorithmes permettant de classer, d'analyser et d'exploiter les informations (sous forme textuelle ou sous forme de liens) issues du Web et utiliser ces algorithmes ;
  • Prendre les bonnes décisions dans des processus de recherche d'information sur le Web et/ou d'analyse de ces informations.
 
Contenu
Le Web Mining est l’application de techniques et modèles permettant de rechercher, récolter, nettoyer, analyser, classer et recommander des informations/données issues du Web. Ces techniques sont notamment utilisées dans les moteurs de recherche, qui jouent un rôle central dans la société de l’information connectée, ainsi que les réseaux sociaux. Ce cours a pour objectif d’apprendre à maîtriser ces techniques et modèles, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont:
  • Recherche d’information sur le Web
    • Concepts de base
    • Modèles de recherche d’information
    • Collecter, nettoyer et analyser les données issues du Web
  • Text Mining: Analyse de données textuelles issues du Web
    • Eléments fondamentaux de l'analyse de textes (corpus, bag of words, etc.)
    • Extraction de termes et représentation de documents (word embedding)
    • Catégorisation de documents
    • Analyse
  • Link Analysis : Analyse de contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe, des données issues du Web
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • etc.
Méthodes d'enseignement
  • Exposés magistraux
  • Exercices intégrés au cours
  • Projet par groupe
Modes d'évaluation
des acquis des étudiants
  • Réalisation d'un projet de groupe;
  • Défense orale du projet et examen oral, en session.
!!! Le cours est un cours à évaluation unique (i.e., une fois la note obtenue pour le cours, elle est définitive pour toute l'année académique, et ne peut donc plus être améliorée par la suite) !!!
Ressources
en ligne
Voir Student Corner / Teams
Bibliographie
  • MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
  • LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
  • FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
  • AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
  • MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
  • MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
Faculté ou entité
en charge
CLSM


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] : ingénieur de gestion

Master [120] : ingénieur de gestion