¿Son fiables los datos de generados por la Información Geográfica Voluntaria? Repasamos tres trabajos sobre la calidad de OpenStreetMap

La Información Geográfica Voluntaria (IGV) ha significado una nueva forma de producir y consumir cartografía. Hasta hace unos años los institutos y organismos oficiales generaban la cartografía que utilizábamos el resto de la sociedad. En la actualidad se han sumado grandes empresas tecnológicas (Google, Apple…) pero también grupos de personas voluntarias o comunidades interesadas en participar (e influir) en la recreación del territorio.

Los beneficios de la IGV son ampliamente conocidos: fuente principal de cartografía en zonas donde no existe o solo se cuenta con cartografía oficial muy limitada, complemento de la información geográfica oficial en otras o información rápida en situaciones de emergencia y catástrofes, son solo algunos ejemplos.

También existen problemas, y no son menores, como la actualización, el mantenimiento en el tiempo, la homogeneidad de la información y especialmente la calidad de los datos. Sin embargo la opinión general es que la IGV va a ser cada vez más importante, como más importante va a ser la colaboración entre los organismos oficiales productores de cartografía y la IGV.

Pero en este caso, ¿nos podremos fiar de datos proporcionados por la Información Geográfica Voluntaria? Para responder a la pregunta un gran número de estudios se centran en medir la calidad en OpenStreetMap (OSM), quizá el proyecto más importante de IGV por su transcendencia y la comunidad activa que la sostiene. Veamos algunos de ellos.

Comparando calidad OpenStreetMap vs IGN en la Comunidad de Madrid (2011)

Antonio Villena Martín y Antonio F. Rodríguez Pascual presentaron en las Jornadas Ibéricas de Infraestructuras de Datos Espaciales de 2011 (JIIDE 2011) un trabajo (1) para determinar la calidad de OSM en la Comunidad de Madrid (España). En él resaltaban la excelente exactitud posicional de los elementos lineales de OpenStreetMap para escalas a partir de 1:50.000. También destacan como la compleción de la información, que mide la presencia y ausencia de fenómenos, sus atributos y relaciones, es muy alta en algunos temas (caminos rurales), pero deficitaria en algunas zonas con baja densidad de población. Otro de los puntos débiles de OSM según los autores es la exactitud temática o semántica, siendo bastante escasa en cuanto a los nombres de viales y en nombres de población.

Comparando calidad OpenStreetMap vs CartoCiudad en Valencia (2012)

Un año más tarde, en las VI Jornadas de SIG Libre en 2012 N. Fernández Terrones, J.M. De Diego Alarcón y A. Pérez-Navarro presentaban una comparativa (2) entre OpenStreetMap y Cartociudad: caso de estudio de Valencia (España).

En sus conclusiones destacan que OpenStreetMap tiene una precisión posicional más que aceptable para usos de geocodificación y cálculo de rutas óptimas y como existe una mayor actualización de los datos de OpenStreetMap que delos de CartoCiudad. En las limitaciones señalan una carencia importante en la compleción de los etiquetados de ciertos elementos, muy importante teniendo en cuenta que OSM no tiene un modelo cartográfico conceptual con clases. También se han detectado ciertas inconsistencias, como solapamientos entre elementos geométricos o falta de conectividad en la red de calles. En cuanto a la compleción señalan es muy desigual por zonas, siendo alta en las zonas más densamente pobladas.

Comparando calidad OpenStreetMap vs IDECA en Bogotá (2019)

Más reciente es el trabajo (3) de Luis Armando Niño Beltrán, que ha comparado los datos de 2017 de OSM para la malla vial de Bogotá (Colombia) con la generada por una fuente oficial, la Infraestructura de datos Espaciales de Bogotá Distrito Capital, IDECA. Utilizando un enfoque multivariado ha medido los elementos de calidad de completitud, exactitud posicional y exactitud temática.

Niño Beltrán ha comparado el 85% de los datos utilizando un proceso semiautomático que emplea un buffer móvil y el centroide de las vías para realizar las comparaciones correspondientes entre las dos fuentes de datos.

Los resultados indican que los valores de completitud encontrados en OpenStreetMap tienen pocas diferencias respecto a la fuente IDECA (valores de omisión no supera el 14% de elementos lineales y 1% de elementos lineales sobrantes o de comisión). Este rango de valores permitiría por ejemplo utilizar los datos de OSM como datos de referencia por parte de organismos oficiales.

Igual sucede con la exactitud posicional con un valor de 3,98 m, muy similar al error medio cuadrático de 4,85 m encontrados en la Comunidad de Madrid en el estudio de 2011.

Peores datos encontramos para la exactitud temática, tachada de deficiente, donde se calcula que el 31,85% de los datos están mal clasificados, bien por errores en la asignación de la jerarquía vial, del sentido de circulación o en el nombre de la vía.

Midiendo la calidad de la Información Geográfica Voluntaria. Foto cortesía de la Universidad Nacional de Colombia
Midiendo la calidad de la Información Geográfica Voluntaria. Foto cortesía de la Universidad Nacional de Colombia

Conclusiones

Los tres estudios coinciden en analizar la completitud, exactitud posicional y exactitud temática, frente a otros elementos cualitativos o más generales de calidad como el propósito, uso y linaje, credibilidad o confiabilidad del conjunto de datos geográficos, más adecuados para otro tipo de estudios.

Y de estos tres elementos de calidad analizados todos coinciden en resaltar la buena exactitud posicional de OpenStreetMap, lo que unido a que el método de captura de información es sencillo y barato lo hace una opción muy interesante en la elaboración de cartografía oficial entre 1:50.000 y 1:100.000 usados como datos de referencia o en estudios previos de actualización.

Los resultados no son tan buenos al medir la exactitud temática, dónde encontramos etiquetados incompletos o erróneos que se pueden achacar a la falta de un modelo cartográfico conceptual, el gran número de personas que participan en el proyecto y la diversidad de fuentes de datos que se utilizan en OpenStreetMap.

Enlaces de interés