Más allá del bosque: Los datos abiertos permiten crear la aplicación de Descarga IFN

Con motivo de la convocatoria del Premio ASEDIE 2025, desde ASEDIE entrevistamos a los ganadores de las dos categorías 2024 para conocer cómo han evolucionado los proyectos premiados, sus avances y  logros, a lo largo de los últimos meses.

 Descarga IFN. Proyecto LOD.FOR.TREES (UVa) fue galardonado con  el Premio ASEDIE Impulsando el Conocimiento del Dato 2024. Desde ASEDIE hemos hablado con Guillermo Vega Gorgojo, portavoz del equipo que lo desarrolló, sobre la importancia de los datos, reutilización, descarga IFN y mucho más.

¿Cómo nació la idea de crear “Descarga IFN (Inventario Forestal Nacional)” y qué necesidad concreta queríais resolver?

El Inventario Forestal Nacional (IFN) es uno de los conjuntos de datos más importantes del sector forestal, utilizándose en tareas de gestión, investigación, educación e industria. La realización de una edición del IFN es compleja, al cubrir todo el territorio español y capturar información forestal multivariable con gran exhaustividad y con continuidad en el tiempo. Todo ello requiere un gran esfuerzo de diseño, mucha planificación y trabajo de campo, dirigido por el Ministerio de Transición Ecológica y ejecutado por la empresa TRAGSA. 

Pero no es fácil utilizar el IFN: además de un conocimiento profundo del dominio forestal, hacen falta conocimientos de bases de datos y un gran esfuerzo en la preparación de los datos para poder usarlos. Este esfuerzo se debe a que el IFN está troceado en provincias y a que hay cambios en el esquema de datos entre ediciones del inventario. Todos los usuarios del IFN tienen que enfrentarse a estos problemas, por lo que es deseable realizar una integración que pueda aprovecharse por todos. Hemos utilizado datos abiertos enlazados (Linked Open Data) para completar esta integración, mejorando los datos originales con información taxonómica de especies, añadiendo enlaces a otras fuentes como Wikidata o WikiSpecies, e incluyendo posiciones WGS84 de árboles y parcelas para facilitar su uso. El resultado lo hemos publicado en el punto SPARQL “Semantic Forest”, disponible de manera abierta en https://semanticforest.gsic.uva.es/sparql 

Cualquiera puede hacer consultas sobre los datos de “Semantic Forest”, por ejemplo: obtener las parcelas puras de pino piñonero en la provincia de Valladolid de la edición 3 del IFN. Pero para ello es necesario conocer los lenguajes de la Web Semántica, especialmente SPARQL y RDF. Esto no suele habitual en los usuarios del IFN, por lo que con “Descarga IFN” hemos querido ofrecer una aplicación interactiva que de manera visual permita seleccionar las parcelas de interés de manera flexible y descargarlas en formatos habituales para los técnicos forestales, como GeoJSON, CSV y XSLX.

¿Qué ventajas ofrece vuestra aplicación frente a otras herramientas como Basifor o el Explorador Forestal?

Basifor es una herramienta que permite procesar datos del IFN, pero no trata el problema de la recuperación de los datos, requiriendo que el usuario los proporcione de manera explícita. Tampoco permite visualizar las parcelas en un mapa, ni filtrar las parcelas de interés por criterios espaciales o de especie (esto no es fácil de hacer, pero es importante).

El Explorador Forestal es una aplicación nuestra que también utiliza el conjunto de datos “Semantic Forest”. Su uso principal es la visualización de datos forestales, fundamentalmente los del IFN y los del Mapa Forestal Español. Bajo mi punto de vista se trata de nuestra aplicación forestal insignia, que hemos mejorado de manera notable en la última actualización (de 2025) con un nuevo motor de acceso de datos, con la inclusión de la edición 2 del IFN y con el nuevo dashboard de parcelas, entre otras mejoras. Sin embargo, el Explorador Forestal incluye una funcionalidad muy básica de descarga de datos y algunos usuarios nos pedían mayor control en la selección de las parcelas a descargar. Esto se alejaba del propósito original del Explorador Forestal (visualización de información forestal a diferentes escalas), por lo que decidimos iniciar un proyecto nuevo que atendiera específicamente la selección multicriterio de parcelas para su descarga. Esto es esencialmente lo que permite “Descarga IFN” en su versión actual.

¿Qué retos técnicos encontrasteis al trabajar con datos de distintas ediciones del IFN?

En un proyecto anterior (el proyecto europeo Cross-Forest) habíamos trabajado en la conversión a datos abiertos enlazados de la edición 3 del IFN. El pasar a múltiples ediciones del IFN nos obligó a plantearnos qué tipo de integración queríamos hacer. Apostamos por una solución muy ambiciosa que permitiera utilizar tanto los datos de una edición del IFN de manera aislada como los de varias ediciones (por ejemplo, para ver la evolución de una parcela a lo largo del tiempo). Esto ha requerido mucho esfuerzo en el modelado de datos, pero creo que el resultado es muy bueno y que ha merecido la pena. Por el camino hemos tenido que solucionar muchos retos técnicos, como el alineamiento de los esquemas de datos del IFN2 y el IFN3 (por ejemplo, los códigos de las especies no son los mismos). Otro problema es que hay ciertos cambios en los datos que se recogen en las diferentes ediciones, con lo que la continuidad no es total.

¿Cómo habéis aplicado el enfoque de datos enlazados abiertos (Linked Open Data) en el proyecto?

El IFN es un caso de datos “lentos”, lleva varios años completar la toma, generación, revisión y publicación de una edición. De hecho, ha habido bastante retraso con el IFN4 y los datos de Andalucía aún no están publicados. Esto nos permite hacer una conversión de los datos originales a datos abiertos enlazados de manera completa (esto se llama materialización). Si los datos fueran más “veloces” este enfoque no sería posible, con lo que tendríamos que hacer la conversión a datos abiertos enlazados al vuelo (mediante reescritura de consultas).
Para ello hemos creado varias ontologías (modelos de datos de la Web Semántica) en las que definimos los términos necesarios para describir los datos. Son varias ontologías porque el IFN es muy extenso y hemos tenido que tomar una aproximación modular. Tenemos ontologías de posiciones, de medidas, de especies, de inventarios forestales… Los datos originales están en formato Microsoft Access, hemos desarrollado unos scripts para la extracción de estos datos y su conversión a CSV para facilitar su procesamiento. Luego hemos definido de manera declarativa conversiones de los CSV a triplas RDF con la herramienta SPARQL-Generate. También hemos creado otros scripts adicionales para validar los datos resultantes y publicarlos en el punto SPARQL de “Semantic Forest”.

¿Qué tipo de usuarios estáis viendo que más utilizan la herramienta: investigadores, gestores forestales, estudiantes...?

En las analíticas web que recogemos estamos viendo un aumento paulatino del uso de Descarga IFN, pero no tenemos un perfilado de usuarios porque no hay registro. Ofrecemos la aplicación de manera abierta y no obligamos a que los usuarios tengan que identificarse para usarla. Al presentar la aplicación en el 9º Congreso Forestal Español nos llegó bastante realimentación de investigadores y académicos. De hecho, nos sorprendió que un profesor de Ingeniería Forestal ya utilizara Descarga IFN en sus clases, teniendo en cuenta que el lanzamiento de la aplicación fue hace menos de un año.

¿Podéis compartir algún ejemplo de uso concreto o impacto que haya tenido la herramienta desde su publicación?

Como decía, en el 9º Congreso Forestal Español nos informaron del uso de la aplicación en docencia y, sobre todo, en proyectos y trabajos de investigación. Un ejemplo es el proyecto financiado por la fundación Biodiversidad llamado Bosque Modelo Palencia, donde se está haciendo un análisis de los recursos forestales a nivel municipal de ese territorio. Gracias a Descarga IFN, han podido seleccionar y descargar fácilmente las parcelas de un territorio formado por 91 municipios, alimentando la plataforma digital monbiofor.

¿Qué mejoras o funcionalidades nuevas tenéis previstas realizar, incorporar el IFN4?

La prioridad es incorporar el IFN4, la última edición del Inventario Forestal Nacional. Este conjunto de datos es muy esperado porque ha habido cierto retraso en su producción (de hecho, todavía no está completamente liberado). Si lo hacemos bien, Descarga IFN podría ser muy útil para realizar investigaciones y estudios longitudinales, al incluir información forestal consistente e integrada de los últimos 40 años para todo el territorio español. También consideramos dar un mayor grado de control al usuario en los datos a descargar. Otro aspecto importante es hacer una evaluación para ver cómo hacer más sencilla la aplicación, detectar posibles mejoras e identificar nuevas funcionalidades de interés.

¿Qué significa para vosotros haber recibido el Premio ASEDIE y cómo ha influido en la visibilidad del proyecto?

Hemos recibido este premio con mucha alegría por todo el equipo. A mí me ha gustado especialmente la valoración de la propuesta y los comentarios recibidos por el jurado de los Premios ASEDIE 2024; transmitían que habían entendido muy bien la propuesta de Descarga IFN y el esfuerzo en la publicación de datos abiertos enlazados del IFN. No siempre se aprecia la importancia de los datos, por lo que agradezco mucho el trabajo de la Asociación ASEDIE en este sentido. Con este premio hemos conseguido mucha visibilidad para Descarga IFN, que ha ayudado a que se use esta aplicación fuera de nuestro ámbito de control. Además, nos viene bien conseguir premios como éste para justificar los resultados de los proyectos de investigación con los que realizamos este tipo de investigaciones.

Siguiente
Siguiente

Transformaciones clave en la normativa europea sobre datos e inteligencia artificial: Avances recientes y perspectivas para el Sector Infomediario