Los organismos oficiales de estadística se enfrentan al reto de adaptarse al entorno digital de datos para no ser ignorados ante el enorme volumen de estadísticas y datos proporcionados por corporaciones privadas.

Ya tienes tu móvil nuevo. Después de configurarlo abres la Play para instalarte Whatsapp y el resto de aplicaciones. Google, al igual que hace obscenamente en YouTube, pero también en las búsquedas, te ofrece una serie de sugerencias basadas en sus intereses, no en los tuyos. Te fijas en la aplicación Linterna, -quien sabe cuando me será de utilidad. Le das a instalar, la aplicación necesita acceder a tus contactos e incluso en algunos casos puede pedir permiso para grabar audio, -¿para que lo necesita?, pero aceptas, no tienes tiempo ni ganas de leerte toda la política de privacidad.

Lees en el El País: «El INE seguirá la pista de los móviles de toda España durante ocho días». Haces una lectura rápida, pero te quedas con el titular, -el Instituto Nacional de Estadística (INE) de España me va espiar- y te escandalizas.

En realidad aunque el titular es desafortunado, la noticia explica con detalle la utilidad del trabajo que se va a hacer y como los datos que se van a utilizar son anónimos. Se van a analizar los movimientos de teléfonos móviles en España durante 8 días de noviembre. Para ver la ubicación el INE dividirá el territorio nacional en 3.500 celdas de distinto tamaño con un mínimo de 5.000 personas en cada una de ellas para asegurar el anonimato. Es cierto que no hay mucha más información sobre la metodología empleada, pero no hay manera que el INE pueda averiguar la identidad de nadie con esos datos, son datos agrupados.

La noticia ha causado cierto revuelo mediático en España aunque en realidad el uso de la explotación de la ubicación es una práctica, que más allá de Google, Facebook y similares, la empresa privada lleva haciendo cierto tiempo en España, especialmente operadoras de telecomunicaciones (que necesitan tener localizados los teléfonos para poder ofrecer su servicio) y bancos (que analizan dónde y cuando hacemos uso de las tarjetas de débito/crédito). De hecho los datos que va a usar el INE para el estudio de la movilidad proceden de las empresas Big Data y geomarketing pertenecientes a las primeras, las operadoras.

Contratos del INE con datos de posicionamiento

Así aparece en el Perfil del Contratante del INE, dónde el organismo informa de las licitaciones que lleva a cabo, donde hay tres licitaciones abiertas para la contratación del «Servicio de elaboración de información agregada y anonimizada sobre movilidad de la población a partir de datos de posicionamiento de teléfonos móviles contenidos en la base de datos», un expediente por cada una de las empresas cuyos servicios se van a contratar y que en total suman medio millón de euros.

Lamentablemente, y en contra de lo que suele ser habitual, los detalles de estas licitaciones no se pueden consultar.

Los servicios a contratar son:

Luca Transit

Luca d3 es la unidad de datos de Telefónica (Movistar) donde con Inteligencia Artificial o Big Data hacen uso de los «datos de nuestros más de 350 millones de clientes» para empresas y administración pública. Uno de sus productos estrella es Luca Transit, que analiza la ubicación de sus clientes para trabajos de movilidad y transporte.

Flux-Vision

Orange Flux Vision es un servicio de la operadora de telecomunicaciones Orange, que ofrece indicadores y patrones de comportamiento de la población a partir de datos recopilados principalmente de sus usuarios. El análisis agregado de fuentes de datos procedente de sus dispositivos móviles es clave en la selección de nuevos puntos de venta en geomarketing, por ejemplo.
Orange tiene también otros servicios que explotan los datos de ubicación, dondeestanmisclientes.es, similar al anterior, pero dirigido a pequeñas empresas y autónomos.

Vodafone-Analytics

Vodafone-Analytics es la plataforma de análisis del Big Data y el análisis de datos de telecomunicaciones en base a la geolocalización del usuario de Vodafone y desarrollada junto con Carto. En su página web podemos leer «Contamos con datos de localización los 365 días del año y las 24 horas del día gracias a las redes móviles».

Caso de uso de Vodafone Analytics y Carto. Imagen cortesía de Geographica (Carto)
Caso de uso de Vodafone Analytics y Carto. Imagen cortesía de Geographica (Carto)

Big Data y estadística oficial

Generar estadísticas de calidad, a un coste razonable y con rapidez es esencial para las instituciones publicas. Los organismos oficiales de estadística se enfrentan al reto de adaptarse al entorno digital de datos para no ser ignorados ante la generación de estadísticas generadas por corporaciones privadas. Es por ello que llevan tiempo trabando en este sentido; organismos como la ONU (1) o la Comisión Europea (2) redactan recomendaciones para el acceso a datos de organizaciones privadas para las estadísticas oficiales; la modernización estadística se está abarcando en Europa desde la estrategia Vision 2020 (3) que cuenta con un proyecto específico de Biga Data para estadística oficial, que impulsa estudios pilotos para explorar el potencial de los grandes conjuntos de datos en las oficinas estadísticas. Liderada por el Eurostat, en común con sus socios del Sistema Estadístico Europeo (SEE), Vision 2020 identifica cinco áreas clave de actuación (el centro son los usuarios, la calidad, las nuevas fuentes de datos, promover la eficiencia en los procesos de producción y mejorar la difusión y la comunicación) y en los que el INE participa como coordinador del paquete de trabajo sobre datos de telefonía móvil.

Para aprender más

En internet puedes encontrar información de calidad sobre el uso del Big Data y nuevas fuentes de datos en la generación de estadística oficial. Por su carácter divulgativo y riguroso un buen sitio para comenzar es con el número que en 2016 dedicó al Big Data la «Revista Índice. Revista de estadística y sociedad», editada por el INE y la Universidad Autónoma de Madrid.

Sobre estadística y ubicación Revista Índice acaba de publicar el primer volumen de un número especial sobre Georreferenciación que complementará con otro el próximo trimestre.

Directamente relacionado con el tema no te debes perder el TFM de 2018 sobre «El reto Big Data para la estadística pública. Estado del arte» de Alberto González Yanes, director del Comité Técnico de la Infraestructura de Datos y Metadatos Estadísticos de Canarias (eDatos) en el Instituto Canario de Estadística (ISTAC).

Si el IBGE brasileño o el INEGI en México son ejemplos de organismos nacionales con competencias en estadística y cartografía, y donde encontrarás abundante documentación, a nivel regional en España tenemos el Instituto de Estadística y Cartografía de Andalucía (IECA). Este último en su estrategia de elaboración del nuevo Plan Estadístico y Cartográfico 2021-2027 ha publicado un «Análisis de las tendencias que marcan la planificación, producción y difusión de la estadística, la información espacial y la cartografía en el ámbito internacional, europeo y nacional» que recomiendo leer por esa visión conjunta, que también tiene a nivel supra regional el UN-GGIM.