L’analyse des données mobiles peut sauver des vies !

Avec la généralisation des GSM s'est développé un nouveau secteur de recherche : l'analyse des données mobiles. Le but ? Etudier des informations inédites sur les comportements sociaux des utilisateurs. Dans les pays du Sud, ces recherches permettent d'évaluer la propagation d'épidémies ou la quantité des ressources alimentaires. Et donc de sauver des vies. Pour y voir plus clair, des chercheurs en mathématiques appliquées de l’UCL ont décrypté toutes les avancées opérées en matière d’analyse des data mobiles depuis 15 ans.

Depuis 15 ans, plus question de quitter la maison sans son GSM ! Le téléphone portable s'est rapidement fait une place dans toutes les poches et son usage est devenu plus qu'une habitude : une évidence. A tel point qu'aujourd'hui, en 2015, 96% de la population mondiale, soit 6,8 milliards d'individus, possèdent un tel appareil, contre 12% en 2000. L'avènement du GSM a révolutionné notre manière de communiquer. Et avec sa généralisation s'est développé un nouveau pan de recherche : les analyses de données mobiles. Car chaque jour, des millions de personnes communiquent, interagissent, jusque dans les endroits du monde les plus reculés. Ces contacts génèrent des données dont il est possible d'extraire des informations capitales sur les comportements sociaux et la mobilité des utilisateurs. Ils offrent une vue d'ensemble sur l'évolution de la société et de ses besoins. « Avec le développement des téléphones portables, on s'est rendu compte qu'il était possible d'observer le comportement des gens comme on n'avait jamais pu le faire auparavant, explique Adeline Decuyper, docteur en mathématiques appliquées et assistante de recherche à l’UCL. Aujourd'hui, on trouve cela logique, mais il y a 15 ans c'était tout nouveau. »

Non, le monde n'est pas un village

Avec Vincent Blondel, recteur de l'UCL, et Gautier Krings, docteurs en mathématiques appliquées, Adeline Decuyper a synthétisé et étudié les recherches qui avaient été faites sur les analyses de données téléphoniques depuis 15 ans. Une étude soutenue par le FNRS. Tous trois ont partagé leurs conclusions dans un article publié par le European Physical Journal Data Science. Dans cet article, ils définissent les différentes méthodologies mises en place par les chercheurs, en pointant particulièrement l'analyse des CDR, les Call Detail Records. Il s'agit des données émises lors des communications mobiles. « Lorsqu'on téléphone, l'opérateur est tenu pour des raisons de facturation d'enregistrer les données, précise Adeline Decuyper. On ne parle pas des contenus, mais le fait qu'un client A ait appelé un client B à tel moment, alors qu'il était connecté à telle antenne, pendant combien de temps. Tout est anonymisé. Parfois on a des informations plus précises comme le genre ou l'âge des utilisateurs si l'opérateur accepte de les partager mais c'est de plus en plus rare pour des raisons de protection de la vie privée ».

Une conclusion qui ressort notamment de plusieurs études : le monde est loin d'être devenu un village ! Les individus ont beau avoir plus de facilités à communiquer, la proximité joue toujours un rôle important dans le maintien du lien social puisque le volume d'appels diminue avec la distance.

Moyenne des dépenses en téléphonie mobile en Côte d'Ivoire

Analyser la mobilité : essentiel dans les pays du Sud

Depuis quelques années, la recherche s'oriente vers les pays du Sud, où le taux de pénétration des téléphones mobiles est en augmentation. Les enjeux de la recherche sur les données mobiles ont ainsi évolué. « On y voit beaucoup d'intérêt  dans le sens où on peut analyser la mobilité des personnes, indique Adeline Decuyper. On peut par exemple évaluer comment va se développer une épidémie ou estimer la densité de population dans les zones les plus reculées. C'est beaucoup plus utile que chez nous, en fait ! ».

L'opérateur Orange a notamment lancé il y a quelques années le Challenge Data for Development. Un appel à projets qui s'appuie sur un partage des données mobiles de Côte d'Ivoire, puis du Sénégal, avec des centaines d'équipes de chercheurs. « Le projet a abouti à des propositions concrètes, comme le fait de redessiner le réseau de transports en commun d'Abidjan selon les besoins de ses habitants. » De son côté, Adeline Decuyper a participé à un projet sur les pénuries alimentaires, avec les Nations Unies et le World Food Programme. « Il s'agissait de localiser les populations qui avaient le plus besoin d'aide en matière d'accès à la nourriture. Le World Food Programme travaille généralement en envoyant des personnes sur place, ce qui coûte des centaines de milliers de dollars, et les informations sont rapidement périmées. Le projet qu'on a mené a permis de croiser les analyses de données téléphoniques avec les résultats d'enquêtes sur le terrain et de tirer des conclusions. Avec les données mobiles, on peut estimer les dépenses en nourriture des foyers. On peut prédire leur consommation de carottes, par exemple. De là, on peut avoir une bonne idée du niveau de sécurité alimentaire dans chaque région, et savoir où envoyer de l'aide si nécessaire. Utiliser ces données ne coûte rien, or elles peuvent sauver des vies ».

La protection de la vie privée pas oubliée

Certes, ces études sont basées sur un échantillonnage. Vu le caractère partiel des informations, il existe une marge d'erreurs. Mais si l’échantillonnage est imparfait, il est néanmoins pertinent : il concerne une proportion significative de la population (souvent 30 à 50%). De plus, dans certains cas, les analyses des données mobiles sont les seules qui peuvent être mises rapidement en œuvre sur un territoire. Pour recenser la population, par exemple. « On essaie toujours de valider un maximum d'observations, insiste Adeline Decuyper. Parfois, on ne sait pas jusqu'à quel niveau c'est correct, mais c'est mieux que rien du tout ». A l'heure où la protection de la vie privée est plus que jamais au cœur des préoccupations, les scientifiques rappellent que leurs recherches sont réalisées dans un cadre réglementé. Ils travaillent à l'aide de données anonymisées, même si une partie de la richesse des informations est dès lors perdue. Ils sont liés par un contrat de confidentialité, et leur rôle est aussi de mettre en évidence les potentiels d'utilisation malveillante, d'étudier comment s'en prémunir.

Coup d'oeil sur la bio de Vincent Blondel

Vincent Blondel

2014 : Recteur de l'UCL
2000-2014 : Professeur en mathématiques appliquées à l'UCL
2010-2011 : Formation en management et administration publique au Harvard Kennedy School of Government
2005-2011 : Professeur invité au Massachusetts Institut of Technology (MIT)
1993-1995 : Post-doctorats au Royal Institute of Technology (KTH) de Stockholm et à l'Institut National de Recherche en Informatique et en Automatique (INRIA) de Paris
1992 : Docteur en mathématiques appliqués à l'UCL
1988 : Diplôme d'ingénieur en mathématiques appliquées à l'UCL

​​​​​​Coup d'oeil sur la bio d’Adeline Decuyper

Adeline Decuyper

2015 : Docteure en mathématiques appliquées (UCL)
Thèse financée par le FNRS sur l'analyse de Big Data et l'utilisation de data pour le développement, supervisée par Vincent Blondel et Jean-Charles Delvenne
2014 : Travail de 3 mois avec les Nations Unies et le World Food Programme dans le cadre d'un projet sur d'utilisation de données téléphoniques pour la sécurité alimentaire en Afrique
2011 : Master en sciences de l'ingénieur en mathématiques appliquées à l'UCL et Master en mathématiques au Royal Institute of Technology (KTH) de Stockholm

Coup d'oeil sur la bio de Gautier Krings

Gautier Krings

Depuis 2014 : Chargé de cours invité en sciences des données à l'UCL
Depuis 2011 : Chief Scientist au Real Impact Analytics, une startup belge qui travaille dans le développement analytique des solutions pour les opérateurs en téléphonie et se concentre sur les marchés émergents
2012 : Docteur en mathématiques appliquées (UCL)
2009 : Chercheur au Massachusetts Institut of Technology (MIT)
2007 : Diplôme d'ingénieur en mathématiques appliquées à l'UCL

Publié le 04 janvier 2016