Avec la généralisation des GSM s'est développé un nouveau secteur de recherche : l'analyse des données mobiles. Le but ? Etudier des informations inédites sur les comportements sociaux des utilisateurs. Dans les pays du Sud, ces recherches permettent d'évaluer la propagation d'épidémies ou la quantité des ressources alimentaires. Et donc de sauver des vies. Pour y voir plus clair, des chercheurs en mathématiques appliquées de l’UCL ont décrypté toutes les avancées opérées en matière d’analyse des data mobiles depuis 15 ans.
Depuis 15 ans, plus question de quitter la maison sans son GSM ! Le téléphone portable s'est rapidement fait une place dans toutes les poches et son usage est devenu plus qu'une habitude : une évidence. A tel point qu'aujourd'hui, en 2015, 96% de la population mondiale, soit 6,8 milliards d'individus, possèdent un tel appareil, contre 12% en 2000. L'avènement du GSM a révolutionné notre manière de communiquer. Et avec sa généralisation s'est développé un nouveau pan de recherche : les analyses de données mobiles. Car chaque jour, des millions de personnes communiquent, interagissent, jusque dans les endroits du monde les plus reculés. Ces contacts génèrent des données dont il est possible d'extraire des informations capitales sur les comportements sociaux et la mobilité des utilisateurs. Ils offrent une vue d'ensemble sur l'évolution de la société et de ses besoins. « Avec le développement des téléphones portables, on s'est rendu compte qu'il était possible d'observer le comportement des gens comme on n'avait jamais pu le faire auparavant, explique Adeline Decuyper, docteur en mathématiques appliquées et assistante de recherche à l’UCL. Aujourd'hui, on trouve cela logique, mais il y a 15 ans c'était tout nouveau. »
Non, le monde n'est pas un village
Avec Vincent Blondel, recteur de l'UCL, et Gautier Krings, docteurs en mathématiques appliquées, Adeline Decuyper a synthétisé et étudié les recherches qui avaient été faites sur les analyses de données téléphoniques depuis 15 ans. Une étude soutenue par le FNRS. Tous trois ont partagé leurs conclusions dans un article publié par le European Physical Journal Data Science. Dans cet article, ils définissent les différentes méthodologies mises en place par les chercheurs, en pointant particulièrement l'analyse des CDR, les Call Detail Records. Il s'agit des données émises lors des communications mobiles. « Lorsqu'on téléphone, l'opérateur est tenu pour des raisons de facturation d'enregistrer les données, précise Adeline Decuyper. On ne parle pas des contenus, mais le fait qu'un client A ait appelé un client B à tel moment, alors qu'il était connecté à telle antenne, pendant combien de temps. Tout est anonymisé. Parfois on a des informations plus précises comme le genre ou l'âge des utilisateurs si l'opérateur accepte de les partager mais c'est de plus en plus rare pour des raisons de protection de la vie privée ».
Une conclusion qui ressort notamment de plusieurs études : le monde est loin d'être devenu un village ! Les individus ont beau avoir plus de facilités à communiquer, la proximité joue toujours un rôle important dans le maintien du lien social puisque le volume d'appels diminue avec la distance.
Analyser la mobilité : essentiel dans les pays du Sud
Depuis quelques années, la recherche s'oriente vers les pays du Sud, où le taux de pénétration des téléphones mobiles est en augmentation. Les enjeux de la recherche sur les données mobiles ont ainsi évolué. « On y voit beaucoup d'intérêt dans le sens où on peut analyser la mobilité des personnes, indique Adeline Decuyper. On peut par exemple évaluer comment va se développer une épidémie ou estimer la densité de population dans les zones les plus reculées. C'est beaucoup plus utile que chez nous, en fait ! ».
L'opérateur Orange a notamment lancé il y a quelques années le Challenge Data for Development. Un appel à projets qui s'appuie sur un partage des données mobiles de Côte d'Ivoire, puis du Sénégal, avec des centaines d'équipes de chercheurs. « Le projet a abouti à des propositions concrètes, comme le fait de redessiner le réseau de transports en commun d'Abidjan selon les besoins de ses habitants. » De son côté, Adeline Decuyper a participé à un projet sur les pénuries alimentaires, avec les Nations Unies et le World Food Programme. « Il s'agissait de localiser les populations qui avaient le plus besoin d'aide en matière d'accès à la nourriture. Le World Food Programme travaille généralement en envoyant des personnes sur place, ce qui coûte des centaines de milliers de dollars, et les informations sont rapidement périmées. Le projet qu'on a mené a permis de croiser les analyses de données téléphoniques avec les résultats d'enquêtes sur le terrain et de tirer des conclusions. Avec les données mobiles, on peut estimer les dépenses en nourriture des foyers. On peut prédire leur consommation de carottes, par exemple. De là, on peut avoir une bonne idée du niveau de sécurité alimentaire dans chaque région, et savoir où envoyer de l'aide si nécessaire. Utiliser ces données ne coûte rien, or elles peuvent sauver des vies ».
La protection de la vie privée pas oubliée
Certes, ces études sont basées sur un échantillonnage. Vu le caractère partiel des informations, il existe une marge d'erreurs. Mais si l’échantillonnage est imparfait, il est néanmoins pertinent : il concerne une proportion significative de la population (souvent 30 à 50%). De plus, dans certains cas, les analyses des données mobiles sont les seules qui peuvent être mises rapidement en œuvre sur un territoire. Pour recenser la population, par exemple. « On essaie toujours de valider un maximum d'observations, insiste Adeline Decuyper. Parfois, on ne sait pas jusqu'à quel niveau c'est correct, mais c'est mieux que rien du tout ». A l'heure où la protection de la vie privée est plus que jamais au cœur des préoccupations, les scientifiques rappellent que leurs recherches sont réalisées dans un cadre réglementé. Ils travaillent à l'aide de données anonymisées, même si une partie de la richesse des informations est dès lors perdue. Ils sont liés par un contrat de confidentialité, et leur rôle est aussi de mettre en évidence les potentiels d'utilisation malveillante, d'étudier comment s'en prémunir.