“Big data”: ¿pueden los datos móviles contribuir al diseño de mejores políticas públicas?

“Big data”: ¿pueden los datos móviles contribuir al diseño de mejores políticas públicas?

Mobile data could contribute to creating “sustainable cities and communities”.

(AP/Frank Franklin II )

La actual Cuarta Revolución Industrial ha traído consigo “un volumen ingente de datos generados a gran velocidad y disponibles”, explica a Equal Times la directora global de Investigación en Datos de Vodafone y chief data scientist en la organización Data-Pop Alliance, Nuria Oliver. Se trata del big data, “datos no estructurados –no son números almacenados en una base– como imágenes, textos, voz o vídeo que requieren técnicas de almacenamiento y de procesamiento muy diferentes a las empleadas hace 20 años”, matiza Oliver.

“Parte del big data lo generan sensores como aceleradores de partículas o telescopios astronómicos, pero la parte generada por nosotros refleja aspectos de nuestro comportamiento: como las búsquedas en Internet, transacciones bancarias y las interacciones en las redes sociales o con los móviles. Hay más móviles que personas, por lo que éstos se pueden considerar sensores (medidores) de una población o país entero”, señala la directora científica.

“Además, es el dispositivo tecnológico con más adopción en la historia de la humanidad y el más potente. Como especie, nunca habíamos tenido un instrumento que nos permitiera medir el comportamiento humano a gran escala. Y el móvil lo hace”, explica Oliver. De hecho, en 2013 el MIT Technologies Review describió la idea de usar los móviles como un “sensor de humanidad” como una de las tecnologías disruptivas de ese año.

“Decisiones de alcance global que hasta ahora se han tomado sin tener en cuenta datos cuantitativos de la población, por primera vez se pueden tomar haciéndolo”, explica Oliver. Es decir, estos permiten comprender patrones globales de comportamiento humano muy útiles a la hora de abordar cuestiones sociales. En concreto los denominados algoritmos “para el bien social” (for social good), aquellos que optimizan los recursos en bienes públicos, como la salud, la seguridad, el acceso a la educación o el empleo justo.

“En mi experiencia en la ONU y en el Banco Mundial, la idea es cómo podemos aprovechar estos datos para mejorar las decisiones que tomamos, sustentando los argumentos dados con menos sesgos y limitaciones. Los humanos tenemos conflictos de intereses, incapacidades, intereses ocultos...”, cuenta la científica española.

Big data y Objetivos de Desarrollo Sostenible

La última cumbre sobre estadística y datos de la ONU revela que el 78% de la población mundial entre 18 y 44 años tiene sus teléfonos inteligentes a mano 22 horas diarias, convirtiendo a los datos móviles en una potente herramienta para alcanzar los Objetivos de Desarrollo Sostenible (ODS) adoptados en la Agenda 2030.

Usarlos para medir las emisiones de CO2 es lo que hace el proyecto piloto de Nuremberg (ODS 13, acción climática).

Utilizando algoritmos propios, la empresa de análisis de datos Teralytics transformó en flujos de movilidad datos de móviles –convertidos en anónimos previamente– generados en la red de Telefónica Alemania, identificando así más de 1,2 millones de rutas. Después, South Pole Group, empresa experta en soluciones de sostenibilidad, modeló los niveles de contaminación, teniendo en cuenta la información del Ministerio Federal de Medio Ambiente y los datos meteorológicos del país centroeuropeo.

“El 70% de las emisiones de gases de efecto invernadero se producen en las ciudades, por lo que éstas juegan un papel clave [cuando abordamos la cuestión de] la protección ambiental”, añade Renat Heuberger, director ejecutivo de South Pole Group, que ve “un gran potencial en el uso de datos generados diariamente, como los de redes móviles, para reducir los niveles de contaminación urbanos”.

“Los algoritmos parecen algo muy abstracto. Este proyecto piloto conjunto muestra cómo, con su ayuda, se pueden abordar problemas y retos sociales reales”, apunta Maximilian Groth, desarrollador de negocio de Teralytics. “Las conclusiones sobre cómo podemos manejar mejor el tráfico, son especialmente relevantes para nosotros. Los resultados obtenidos podrían conducir a una evaluación realista de dichos mecanismos de regulación”, afirma Peter Pluschke, concejal y jefe del departamento de Política Ambiental y Salud de Núremberg.

Predicción de “zonas calientes” de delincuencia

Los datos móviles pueden ser útiles para crear “ciudades y comunidades sostenibles” (ODS 11), como demuestra este proyecto sobre predicción de delitos en Londres donde colaboran el Media Lab del MIT, el departamento de investigación de Telefónica España, la Fundación Bruno Kessler, la Data-Pop Alliance y la Universidad italiana de Trento. “Para predecir si en un barrio de Londres en particular incrementarán los delitos el mes siguiente o no –si habrá más o menos delitos que la media por barrio en la zona metropolitana–, usamos información demográfica junto con la de movilidad humana proporcionada por los datos anonimizados y agregados de las redes de telefonía móvil”, explica a Equal Times el investigador Andrey Bogomolov, especialista en Inteligencia Artificial, Minería de Datos e Informática de la facultad de Ciencias Sociales, Artes y Humanidades de la Universidad de Trento.

“Nuestros hallazgos avalan la hipótesis de que los datos conductuales capturados por esas redes, combinados con información demográfica básica, pueden realizar esa predicción. Nuestro modelo conjunto de machine learning alcanza una precisión del 68,37% cuando usa solo la información demográfica y los datos móviles, y un 69,54% cuando añadimos los datos del censo (proporción de migrantes, tasa de empleo, etnicidad, zonas verdes, delitos, precio de la vivienda, esperanza de vida, niveles formativos…)”, afirma el científico.

“La diversidad y la regularidad del comportamiento humano agregado añade mucha más información respecto a las estadísticas oficiales, menos útiles que las dinámicas humanas debido a que su resolución temporal –precisión de una medida con respecto al tiempo– es más baja”, matiza.

Bogomolov deja claro que su proyecto no tiene nada que ver con la idea de precrimen plateada por Philip K. Dick en su relato Minority Report. “Más bien la tecnología que hay tras nuestra investigación podría ser usada para una distribución óptima de los recursos policiales y en acciones políticas del gobierno local”.

Asegura además que los métodos de inteligencia artificial para predecir “zonas calientes” de delincuencia como este, no garantizan ni “sitios seguros” ni “la paz”. “Son los gobiernos los que tienen que actuar”, subraya. “Esperamos que, si tales tecnologías se hicieran públicas y se desarrollaran en tiempo real, los delincuentes podrían modificar su comportamiento al pensar que la policía puede prever más actividad criminal en un área específica en un tiempo específico. Este es un tema de investigación más profunda por parte de la ciencia del comportamiento y desde la perspectiva de la ‘Teoría de Juegos’”, explica a este medio.

Privacidad y falta de transparencia, “lado oscuro” del big data

“Las principales precauciones a tener en cuenta están relacionadas con la privacidad de las personas y con la naturaleza conflictiva de los sistemas de aprendizaje automático que modelan el comportamiento humano”, recuerda Bogomolov.

Es lo que estudio de la Data-Pop Alliance y la Fundación Bruno Kessler denomina su “lado oscuro”: posible violación de la privacidad individual y colectiva, asimetría en la información, falta de transparencia, exclusión social y discriminación.

“Se trata de centrarse en el potencial de las políticas basadas en datos para que refuercen las poderosas funciones de los algoritmos como herramientas generadoras de valor, minimizando su lado oscuro”, sostiene el texto. “Aquí aparece la opacidad frente a la transparencia: para tomar decisiones más objetivas y justas, debemos ser conscientes de las potenciales limitaciones de esos algoritmos, y si los datos tienen sesgos –si no son representativos de la población de interés–, los algoritmos también los tendrán”, señala Oliver, una de sus autoras.

“La interpretabilidad es importante. Muchos de los algoritmos actuales son [como] cajas negras, y es difícil interpretar qué están haciendo exactamente. Funcionan muy bien, pero no sabemos explicar por qué. Y en el contexto de decisiones que afectan a personas, es necesario poder hacerlo, no solo para tener la certeza de que esas decisiones son las adecuadas sino para explicar por qué lo son”, apostilla la experta.