« Big data » : Les données mobiles peuvent-elles contribuer à la conception de meilleures politiques publiques ?

La Quatrième Révolution industrielle en cours a apporté dans son sillage « un volume faramineux de données générées à grande vitesse et disponibles », a expliqué lors d’un entretien avec Equal Times Nuria Oliver, directrice mondiale de l’analyse des données de Vodafone et chercheuse en chef au sein de l’organisation Data-Pop Alliance. Il est question de big data, à savoir « de données non structurées – il ne s’agit pas de chiffres stockés dans une base de données – par exemple, des images, des textes, des enregistrements de voix ou des vidéos, qui requièrent des techniques de stockage et de traitement très différentes de celles utilisées il y a vingt ans », indique Nuria Oliver.

« Si le big data est généré, en partie, par des senseurs, par exemple des accélérateurs de particules ou des télescopes astronomiques, la partie qui est générée par nous reflète des aspects de notre comportement : Comme les recherches sur Internet, les transactions bancaires et les interactions sur les réseaux sociaux ou entre téléphones portables. Les téléphones portables étant plus nombreux que les personnes, ils peuvent être considérés comme des senseurs (compteurs) pour une population ou un pays entier. Qui plus est, il s’agit du dispositif technologique le plus largement adopté de l’histoire de l’humanité et aussi le plus puissant.

En tant qu’espèce, jamais encore n’avions-nous disposé d’un instrument nous permettant de mesurer le comportement humain à grande échelle. Avec le téléphone portable, c’est désormais possible », explique madame Oliver. De fait, en 2013 la publication MIT Technologies Review décrivait l’utilisation du portable en tant que « senseur de l’humanité » comme l’un des concepts technologiques les plus révolutionnaires de cette année.

« Des décisions de portée globale qui, jusqu’ici, ont été prises sans tenir compte des données quantitatives de la population peuvent, pour la première fois, être prises en en tenant compte », explique la chercheuse. Elles nous permettent en fait de comprendre des modes globaux de comportement humain, très utiles à l’heure d’aborder les enjeux sociaux. Nommément, les algorithmes « pour le bien social » (for social good), à savoir ceux qui optimisent l’allocation de ressources aux biens publics, comme la santé, la sécurité, l’accès à l’éducation ou l’emploi juste.

« Partant de mon expérience à l’ONU et à la Banque mondiale, l’idée serait de savoir comment nous pouvons tirer parti de ces données pour améliorer les décisions que nous prenons, en appuyant les arguments avancés avec moins de biais et de limitations. Nous les êtres humains avons des conflits d’intérêts, des déficiences, des intérêts cachés… », signale la chercheuse espagnole.

Le Big data et les objectifs de développement durable

Le dernier Forum mondial de l’ONU sur les données et les statistiques a révélé que 78 % de la population mondiale entre 18 et 44 ans avait un smartphone à portée de main 22 heures sur 24, convertissant les données mobiles en un puissant outil en vue de la réalisation des Objectifs de développement durable (ODD) adoptés dans le cadre du Programme 2030.

Ils sont d’ores et déjà utilisés pour mesurer les émissions de CO2 dans le cadre du projet pilote de Nuremberg (ODD 13, mesures contre les changements climatiques).

En se servant d’algorithmes propres, la firme Teralytics, spécialisée dans l’analyse de données, a traduit sous forme de flux de mobilité les données mobiles – préalablement anonymisées – générées sur le réseau de téléphonie mobile allemand, ce qui lui a permis d’identifier plus de 1,2 millions de routes différentes. Par la suite, South Pole Group, une entreprise spécialisée dans les solutions de durabilité, s’est livrée à une modélisation des niveaux de pollution, prenant en compte les données du ministère fédéral de l’Environnement, ainsi que les données météorologiques allemandes.

« 70 % des émissions de gaz à effet de serre proviennent des villes, qui jouent dès lors un rôle-clé à l’heure d’aborder [la question de] la protection de l’environnement », ajoute Renat Heuberger, directeur exécutif de South Pole Group, qui voit « un grand potentiel dans l’utilisation des données générées au quotidien, comme celles des réseaux de téléphonie mobile, notamment pour ce qui a trait à la réduction des taux de pollution urbains ».

« Les algorithmes paraissent être quelque chose de très abstrait. Ce projet pilote conjoint montre comment, grâce à eux, il est possible de s’attaquer à des problèmes et à des défis sociaux concrets », souligne Maximilian Groth, responsable du développement commercial chez Teralytics. « Les conclusions sur comment nous pouvons mieux gérer le trafic sont particulièrement pertinentes pour nous. Les résultats obtenus pourraient conduire à une évaluation réaliste des mécanismes de gestion en question », affirme Peter Pluschke, conseiller et directeur du département de politique environnementale et de santé de Nuremberg.

Prédiction de « zones chaudes » de délinquance

Les données mobiles peuvent être utiles pour créer des « villes et des communautés durables » (ODD 11), comme le démontre ce projet sur la prédiction de délits à Londres, auquel collaborent Media Lab du MIT, le département de recherche de Telefónica España, la Fondation Bruno Kessler, la Data-Pop Alliance et l’Université de Trente, en Italie.

« Pour prévoir si les délits augmenteront ou non dans un quartier donné de Londres au cours du mois suivant – s’il y aura plus ou moins de délits que la moyenne par quartier de la zone métropolitaine – nous nous appuyons sur les informations démographiques en même temps que sur celles concernant la mobilité humaine, toutes deux fournies par les données anonymisées et agrégées des réseaux de téléphonie mobile », explique à Equal Times le chercheur Andrey Bogomolov, spécialiste en intelligence artificielle, exploration de données et informatique à la faculté des sciences sociales, des arts et des humanités de l’Université de Trente.

« Nos découvertes viennent démontrer l’hypothèse selon laquelle les données comportementales relevées par ces réseaux, combinées aux données démographiques de base, peuvent permettre de réaliser cette prédiction. Notre modèle conjoint de machine learning (apprentissage automatique) atteint un taux d’exactitude de 68,37 % quand il utilise uniquement l’information démographique et les données mobiles, et de 69,54 % quand on y combine les données du recensement (proportion de migrants, taux d’emploi, ethnicité, zones vertes, délits, prix du logement, espérance de vie, niveaux de formation...) », affirme le chercheur.

« La diversité et la régularité du comportement humain agrégé fournit un complément d’informations substantiel au regard des statistiques officielles, moins utiles que les dynamiques humaines dès lors que leur résolution temporelle – nécessité d’une mesure relative au temps – est moindre », indique-t-il.

Bogomolov indique clairement que son projet n’a rien à voir avec la notion de précrime avancée par Philip K. Dick dans sa nouvelle Minorty Report (Rapport minoritaire). « Plutôt, que la technologie qui se trouve derrière notre recherche puisse être exploitée pour une distribution optimale des ressources policières, ainsi que dans le cadre des mesures politiques du gouvernement local. »

Il précise aussi que les approches d’intelligence artificielle pour prédire les « zones chaudes » de délinquance comme dans ce cas ne garantissent ni des « lieux sûrs » ni « la paix ». « C’est aux gouvernements d’agir », souligne-t-il. « Nous espérons que si de telles technologies passent dans le domaine public et se développent en temps réel, cela puisse inciter les délinquants à modifier leur conduite dès lors qu’ils prennent conscience du fait que la police a la capacité de prévoir une recrudescence de l’activité criminelle dans une zone et à un moment spécifiques. Il s’agit d’un thème de recherche approfondie relevant de la science du comportement, qui part de la perspective de la ‘Théorie des jeux’ », explique l’expert à Equal Times.

Vie privée et manque de transparence, le « côté obscur » du big data

« Les principales précautions à prendre en compte se rapportent à la vie privée des personnes et à la nature conflictuelle des systèmes d’apprentissage automatique qui façonnent le comportement humain », rappelle Bogomolov.

Ce que l’étude de la Data-Pop Alliance et de la Fondation Bruno Kessler nomme « son côté obscur » : Violation possible de la vie privée individuelle et collective, asymétrie de l’information, manque de transparence, exclusion sociale et discrimination.

« Il s’agit de se centrer sur le potentiel des politiques basées sur les données afin qu’elles renforcent les fonctions puissantes des algorithmes en tant qu’outils générateurs de valeur, tout en minimisant leur côté obscur », signale le rapport. « On voit ici surgir l’opacité face à la transparence : Pour prendre des décisions plus objectives et justes, nous devons être conscients des limitations possibles de ces algorithmes et si les données sont biaisées – si elles ne sont pas représentatives de la population cible-, les algorithmes le seront eux aussi », signale Nuria Oliver, qui figure parmi les auteurs du rapport.

« L’interprétabilité a toute son importance. La plupart des algorithmes actuels sont [comme] des boîtes noires et il est difficile d’interpréter ce qu’ils font exactement. Ils fonctionnent très bien mais nous ne savons expliquer pourquoi. Et dans le contexte de décisions qui affectent des personnes, il est nécessaire de pouvoir le faire, pas seulement pour avoir la certitude que ce sont bien les décisions appropriées mais aussi et surtout pour expliquer pourquoi elles le sont », insiste l’experte.

Cet article a été traduit de l'anglais.