Enseignants
Langue
d'enseignement
d'enseignement
Anglais
Contenu
Le contenu des cours sera divisé en 3 chapitres :
- Introduire la notion de big data et de gestion des données (stockage de données, bases de données relationnelles, noSQL,AI)
- Data Mining (apprentissage supervisé et non supervisé, analyse prédictive, réduction de dimension)
- Exploration de textes et d'images (modélisation de sujets, classification de textes, extraction de mots clés, analyse de tendances, analyse d'images)
Méthodes d'enseignement
Ce cours couvrira la théorie de certaines méthodes populaires d'exploration de données et d'apprentissage automatique avec des applications pratiques en marketing. Aucune compétence en programmation n'est nécessaire. L'idée de l'enseignement est que l'instructeur présentera la théorie derrière les méthodes et illustrera comment ces méthodes sont appliquées en marketing.
Pour les cours théoriques, les slides utilisés sont mis à disposition dans Moodle. Des références plus spécifiques sont fournies lors des cours ou dans les slides.
Plusieurs cas pratiques étant présentés dans les cours théoriques, toutes les sources de données et workflows seront mis à disposition sur Moodle afin que les étudiants puissent reproduire les résultats.
Pour les cours théoriques, les slides utilisés sont mis à disposition dans Moodle. Des références plus spécifiques sont fournies lors des cours ou dans les slides.
Plusieurs cas pratiques étant présentés dans les cours théoriques, toutes les sources de données et workflows seront mis à disposition sur Moodle afin que les étudiants puissent reproduire les résultats.
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
L'évaluation comprend deux parties
Seul l'examen écrit (partie 1) peut être repassé en seconde session en cas d'échec. La note pour la partie 2 (le projet d'équipe) sera automatiquement reportée en seconde session.
- Un examen écrit (à livre fermé) pesant pour 60 % du total. Cet examen portera sur toute la matière vue en cours (tant théorique que plus appliquée).
- Un projet d'équipe sur des questions marketing spécifiques choisies par les étudiants et pesant pour 40% du total. Le logiciel utilisé pour ce cours est un logiciel open source « no code » appelé orange (https://orangedatamining.com/). Aucune compétence en programmation n'est a priori nécessaire, mais les étudiants qui souhaitent introduire du code python supplémentaire peuvent le faire en utilisant des widgets python spécifiques (cela n'est cependant généralement pas nécessaire).
Seul l'examen écrit (partie 1) peut être repassé en seconde session en cas d'échec. La note pour la partie 2 (le projet d'équipe) sera automatiquement reportée en seconde session.
Autres infos
Les étudiants doivent avoir une bonne compréhension des statistiques et des mathématiques (niveau BA).
Aucune compétence en programmation n'est requise car une solution "no code" a été adoptée pour les travaux pratiques (https://orangedatamining.com/)
Le projet d'équipe sera évalué sur la base d'un document écrit et éventuellement une présentation orale dont la modlaité sera expliquée au cours. Les ensembles de données utilisés et le flux de travail mis en œuvre doivent être décrits dans le document et mis à disposition (probablement via Moodle) pour l'évaluation. Les sources potentielles de données seront discutées en classe.
Dans ce cours, nous promouvons l'utilisation responsable et critique de l'IA générative. Si ces outils sont utilisés, il est crucial d’indiquer explicitement leur application et de reconnaître correctement toutes les sources pertinentes.
Aucune compétence en programmation n'est requise car une solution "no code" a été adoptée pour les travaux pratiques (https://orangedatamining.com/)
Le projet d'équipe sera évalué sur la base d'un document écrit et éventuellement une présentation orale dont la modlaité sera expliquée au cours. Les ensembles de données utilisés et le flux de travail mis en œuvre doivent être décrits dans le document et mis à disposition (probablement via Moodle) pour l'évaluation. Les sources potentielles de données seront discutées en classe.
Dans ce cours, nous promouvons l'utilisation responsable et critique de l'IA générative. Si ces outils sont utilisés, il est crucial d’indiquer explicitement leur application et de reconnaître correctement toutes les sources pertinentes.
Ressources
en ligne
en ligne
Toutes les diapositives présentées en classe ainsi que les flux de travail et la source de données seront mis à disposition via Moodle.
Certaines références supplémentaires spécifiques qui pourraient intéresser les étudiants seront fournies en cours ou dans les diapositives.
Certaines références supplémentaires spécifiques qui pourraient intéresser les étudiants seront fournies en cours ou dans les diapositives.
Bibliographie
Slides are provided through Moodle.
No compulsory reading is needed for this course other than the slides. However some specific references are provided in class for those interested.
Many datasets used in class come from https://www.kaggle.com/
The (free) software used can be downloaded at: https://orangedatamining.com/.
Many explanations for the methods used are available in orange's youtube channel (https://www.youtube.com/@OrangeDataMining)
Faculté ou entité
en charge
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en sciences de gestion
Master [120] : ingénieur de gestion
Master [120] en sciences de gestion
Master [120] : ingénieur de gestion
Master [120] en sciences de gestion (en alternance)