Les Big Data pour mieux cartographier la pauvreté

Combiner différents types de données telles que celles issues de la téléphonie mobile et de l’imagerie satellitaire pour estimer avec précision et de manière régulière l’état de la pauvreté. C’est ce que permet le modèle mis au point par un chercheur de l’UCL.

Sms, appels, messages Facebook, signaux GPS, achats en ligne, informations climatiques, données satellites… A l’heure actuelle, nous disposons d’un volume massif de données en tous genres, baptisé « Big Data ». Véritable mine d’information, ces données sont souvent la cible d’applications commerciales, marketing, de surveillance, … Mais les scientifiques commencent également à s’y intéresser car elles peuvent aussi s’avérer précieuses pour un usage à bénéfice public, comme la lutte contre la pauvreté. Mais encore faut-il savoir combiner et interpréter ces multiples données pour en tirer une analyse utile… C’est ce sur quoi s’est penché Damien Jacques, doctorant FRIA à l’Earth and Life Institute, en collaboration avec une chercheuse indienne de l’Université de New York. Les résultats de leur étude sont parus en octobre dans la prestigieuse revue Proceedings of the National Academy of Sciences of the United States of America (PNAS).

Cartographier la pauvreté pour pouvoir l’éradiquer

« Eliminer la pauvreté d’ici 2030 est le 1er objectif de développement durable des Nations Unies. Mais avant de pouvoir implémenter des politiques, il faut savoir à quel type de problème on fait face, à quel endroit précis et à quelle échelle. Le manque de données est une préoccupation majeure à ce niveau-là. Actuellement, on utilise des enquêtes socio-économiques où on va interroger des ménages sur le terrain mais celles-ci sont coûteuses et ne sont réalisées que tous les 5 ou dix ans ! L’analyse du big data peut donc être un bon complément, entre deux enquêtes ».

Prendre en compte différents types de données

Les deux chercheurs se sont penchés sur les Big Data du Sénégal. L’originalité de leur approche est d’avoir mis au point un modèle statistique qui permet de prendre en compte différents types de données comme par exemple, celles issues de la téléphonie mobile ou des satellites d’observation de la terre. « Jusqu’ici, il était rare de voir des données si différentes être utilisées dans un même modèle » explique Damien Jacques. « Or, c’est important car la pauvreté est un problème complexe ! ». Pour leur étude, les chercheurs ont donc combiné des données sur les interactions sociales, issues de métadonnées d’une compagnie de téléphonie mobile (fréquence d’utilisation du téléphone, régularité et diversité des interactions, …), avec des données « environnementales », issues des données satellites et géographiques :  accès aux services comme l’électricité (lumières la nuit), conditions météo, proximité des écoles, densité des routes, … Et ce, afin de réaliser une meilleure estimation de la pauvreté, commune par commune.

                                                  

Cibler les actions les plus urgentes

Résultat de cette étude : une carte très précise de la pauvreté au Sénégal, avec à chaque fois un indicateur pour trois dimensions distinctes : santé, éducation et niveau de vie. « Grâce à cet indicateur multidimensionnel, on peut dans une région donnée savoir quelle est la dimension prioritaire en termes de mesures publiques, pour diminuer l’indicateur de pauvreté. Dans une zone, on verra par exemple qu’il faut donner la priorité à l’accès à l’électricité. Tandis que dans une autre, ce sera la mise en place d’écoles ! »
Pour vérifier l’exactitude de leur modèle, les chercheurs ont pu croiser leurs résultats avec ceux du dernier recensement réalisé au Sénégal par le gouvernement, ce qui a permis de confirmer leurs résultats.

                                                carte pauvreté sénégal Damien Jacques

Quid de l’accès et la protection des données ?

Est-il facile pour les scientifiques de se procurer les données utilisées ? « Les données satellites utilisées dans cette étude sont accessibles gratuitement et presque en temps réel en ligne. Par contre, pour les données de la téléphonie mobile, il faut négocier avec les compagnies privées, ce qui n’est pas évident. » confie le chercheur.  « Ici, l’accès nous avait été proposé dans le cadre du concours « Data for development » lancé par Orange au Sénégal. Mais ce n’est pas toujours aussi facile... Certaines compagnies peuvent refuser de transmettre ces données, comme cela avait été le cas pendant l’épidémie d’Ebola, alors qu’elles auraient pu être précieuses pour faciliter les secours. A ce niveau, il faudrait mettre en place des partenariats publics-privés ». Mais l’utilisation de ces données privées ne pose-t-elle pas question au niveau éthique ? « L’avantage du modèle que nous avons mis au point est que les compagnies de téléphonie pourraient l’appliquer en interne sur leur base de données et seulement transmettre aux chercheurs les résultats, qu’on pourrait ensuite coupler aux autres données. Il n’y aurait donc pas de transfert de la base de données nécessaire, ce qui garantirait la préservation de la vie privée! »

Et ensuite ?

« La prochaine étape sera de répliquer l’expérience en Côte d’Ivoire pour vérifier les résultats. » explique Damien Jacques, qui ne participera pas à la suite du projet pour se concentrer sur d’autres travaux de recherche. « A terme, on pourrait facilement répliquer le modèle dans n’importe quel pays d’Afrique car l’usage des téléphones mobiles y est très répandu. Pour autant, bien sûr, qu’on ait accès aux données de la téléphonie. ».

« Si les Big Data sont des outils très prometteurs, il faut garder en tête qu’ils ne sont pas la panacée » conclut toutefois Damien Jacques. « Il s’agit d’un complément aux enquêtes de terrain. Pour une meilleure qualité des analyses, il est aussi important que les experts en statistiques et informatique qui manient bien ces outils travaillent davantage en collaboration avec les experts thématiques, qui connaissent mieux la réalité de terrain ».


Cette recherche a été financée par le FNRS et la Gates Foundation et menée par Damien Jacques dans le cadre de sa thèse de doctorat à l’UCL intitulée ”Implementing the data revolution in Senegal towards the Sustainable Development Goals” avec le Pr Pierre Defourny.

 

Coup d’œil sur la bio de Damien Jacques

Damien Jacques

    2012                        Master bioingénieur en sciences et technologies de l'environnement à l’UCL

    Depuis 2013           Doctorat en Sciences agronomiques et Ingénierie biologique (Earth and Life Institute Geomatics LAb)

    Depuis 2017           Assistant de recherche à l'ULB (IGEAT Institut de Gestion de l'Environnement et d'Aménagement du Territoire)

Ses domaines de recherche portent sur la sécurité alimentaire, la pauvreté et l'économie agricole.

Publié le 28 novembre 2017