Con motivo de los talleres que se van a impartir el próximo 17 de noviembre sobre «Introducción a la calidad de la Información Geográfica con R», Elena Chicaiza y Xavier Buenaño han recopilado una serie de recursos de aprendizaje sobre este paquete estadístico y su aplicación en el ámbito del análisis espacial.

En términos de Información Geográfica, en el pasado, la disponibilidad de datos constituía una gran limitante al momento de emprender cualquier estudio o investigación; sin embargo, en la actualidad con el incremento y disponibilidad  de las geotecnologías y las políticas Open Data es posible obtener grandes volúmenes datos, que en muchos de los casos están disponibles en la nube. Por tanto, el reto, ahora, consiste en disgregar los datos e información de relevancia y usar aquellos que posean la calidad que el usuario final requiere (calidad externa) para aplicaciones determinadas (aptitud de uso).

R para el análisis espacial

Actualmente, la mayor cantidad de datos tienen un atributo posicional (espacio - tiempo), por tanto esto ha facilitado la formulación de modelos y aplicaciones para la toma de decisiones a nivel territorial, de ahí que, para evaluar la calidad de cualquier insumo geográfico es necesario ejecutar un proceso estadístico riguroso, junto con la disponibilidad de una herramienta abierta para el usuario.

En este contexto, se vuelve fundamental el uso de herramientas que permitan capturar, analizar y validar datos, de tal forma que pueda usar distintos métodos de acuerdo a su requerimiento. Dentro del amplio abanico de opciones, aparece el software estadístico R de R Project.

R constituye un entorno y lenguaje de programación para el cálculo estadístico y gráfico. El software es fácilmente extensible gracias al uso y creación de funciones y librerías que se encuentran disponibles en repositorios del proyecto (CRAN) o en otros sitios como github. En el caso de CRAN, en el año 2016 se registraron aproximadamente 6.000 librerías, lo cual es una muestra de la demanda y desarrollo que en estos momentos tiene R.

El uso de R está volviéndose masivo a nivel de toda  la comunidad; inicialmente su uso estaba restringido al ámbito científico. El interés que ha despertado R por grandes compañías como es el caso de IBM es un ejemplo de su expansión.

En el caso de ámbito de la Información Geográfica existen un sin número de librerías que pueden ser usadas en las diferentes aplicaciones de la geociencias. A continuación en la Figura 1,  se encuentra un esquema con las librerías más comunes para el ámbito espacial, que han sido usadas en un gran número de aplicaciones y que cuentan con un relevante número de recursos y material de  apoyo para los usuarios, así como ejemplos de casos de uso.

Figura 1. Algunas temáticas de aplicación vinculadas con la IG. Elaboración propia
Figura 1. Algunas temáticas de aplicación vinculadas con la IG. Elaboración propia

 

En cuanto a la evaluación de la calidad de la información geográfica propiamente dicha, de un primer análisis realizado se puede concluir que no existen librerías específicas, sin embargo, librerías como SixSigma, orientadas a la gestión de la calidad dentro de la industria proveen funciones que pueden usarse en el ámbito de la (IG).

Otras de las posibilidades que nos ofrece R, es la presentación resumida del comportamiento de variables y/o indicadores de los conocidos como cuadros de mando o dashboards que juegan un papel fundamental a la hora de tomar decisiones respecto a las variables analizadas con pocos pero efectivos indicadores. Los cuadros de mando pueden ser creados con la librería shiny. Además, está orientada a la creación de aplicaciones, que facilitan la presentación de resultados de forma dinámica. Es de especial ayuda para mostrar variables con una componente espacio-temporal.

En el caso de los gráficos en el entorno R, estos pueden ser clasificados en dos tipos: bajo y alto nivel. La librería ggplot2 permite un máximo nivel de detalle de personalización de las gráficas mediante el uso de geometrías, dependiendo del fenómeno que se desee representar, y con la implementación del concepto de capas para cada uno de los elementos gráficos y en este sentido se clasificarían dentro de las gráficas de alto nivel.

Finalmente, la presentación de reportes constituye una importante herramienta en la difusión y reproducción de resultados de análisis, en el sentido de que el usuario puede acceder a los algoritmos o funciones empleadas en los cálculos y así llegar a obtener un conocimiento más profundo del fenómeno que ha sido analizado. Para usuarios iniciales, el uso de código Markdown facilita la tarea de generación de reportes dinámicos con salidas en formato html, pdf y Word, a través del uso de las librerías RMarkdown y knitr. Si se desea personalizar mucho más el documento de reporte una opción más completa es el uso de código LaTeX.

La Figura 2 presenta las principales librerías relacionadas a la generación de reportes y aplicaciones de control de calidad.

Figura 2. Principales librerías asociadas con diseño muestral, incertidumbre y reportes dinámicos
Figura 2. Principales librerías asociadas con diseño muestral, incertidumbre y reportes dinámicos

El seminario «Introducción a la calidad de la Información Geográfica con R»

Más detalles de lo expuesto, los podrás ver en el taller que se realizará el día jueves 17 de noviembre en Quito, Ecuador, dentro de las «Jornadas Evaluación de la Calidad de la Información Geográfica en América Latina».

Para que puedas aprovechar la charla, debes tener instalado en tu ordenador el software R, que lo puedes descargar desde el repositorio CRAN más cercano a tu residencia. Si estás en Ecuador, lo puedes hacer de la página web: http://cran.espol.edu.ec/. Debes seleccionar el sistema operativo con el que cuentes e instalas R con las opciones por defecto.

Posteriormente debes descargar Rstudio, que es una IDE (ambiente de desarrollo integrado) para R, que permite el manejo más amigable de R. Lo puedes descargar de la página web: https://www.rstudio.com/products/rstudio/download3/ seleccionando la opción que necesites de acuerdo con el sistema operativo que manejes. La versión que descargarás es la v1.0, la cual ha sido recientemente lanzada el 1 de noviembre, y que cuenta con una serie de herramientas nuevas que las veremos en el taller. Por favor instala el software con las opciones por defecto.

Finalmente, una vez que ejecutes RStudio instala las siguientes librerías: markdown, rmarkdown, knitr, raster, rgdal, rasterVis, gstat, ggplot2, DT, SixSigma, shiny, readr, readxl, haven, usando el comando: install.packages, como por ejemplo: install.packages(“raster”) o usando la opción Install del menú Packages de la ventana inferior derecha de RStudio.

Algunos recursos disponibles sobre análisis espacial y R

Actualización diciembre 2016

Elena Chicaiza es miembro de la comisión de Cartografía en IPGH - Ecuador; Xavier Buenaño es investigador en la Universidad Politécnica de Madrid. Impartirán un taller en las Jornadas de calidad de la IG