Soil SaveR — Darwin Geospatial

Erosion Intelligence for Researchers

SOIL SaveR

La erosión es visible desde el espacio.
Los datos para estudiarla, aún no.

Desplaza

Por Qué Importa

La erosión no es solo un problema ambiental

€1.25B coste anual para
agricultores europeos EU JRC / PEER

$37.6B pérdidas anuales de
productividad en EE.UU. NRDC

60% de suelos europeos
degradados EU State of Soils 2024

57.6B t de suelo perdido en
el Medio Oeste de EE.UU. PNAS

El Proyecto

Un gap en los datos que limita lo que podemos aprender.

Los métodos de deep learning para detección de erosión han mostrado resultados prometedores, pero la ausencia de datos públicos dificulta comparar, reproducir o mejorar esos modelos: de 113 artículos revisados, solo 2 comparten datos accesibles, y ambos cubren una única región y un único sensor. Soil SaveR es un intento de empezar a cerrar esa brecha, proponiendo una metodología para generar un dataset etiquetado, público, multimodal y multi-región para detección de erosión desde imágenes satelitales. La metodología combina modelado determinista (RUSLE + índices topográficos del DEM) para acotar automáticamente las zonas candidatas, con verificación visual humana sobre imágenes Sentinel-2, buscando que las etiquetas estén a la vez físicamente fundamentadas y visualmente confirmadas.

10+ fuentes de datos
integradas

3 regiones de
estudio activas

50–60% datos de calidad vía
modelos semi-supervisados

100% abierto y
reproducible

Así se ve la erosión desde el espacio

Patones, Madrid · El mismo territorio en 1956 y 2025. Desliza para revelar los cambios.

Patones · 1956

Patones · 2025

1956

desplaza para revelar

Objetivos & Metodología

Cómo construimos el dataset

El pipeline híbrido

▸ Modelado determinista (RUSLE + DEM) calcula susceptibilidad a la erosión y genera una máscara de zonas candidatas.
▸ Deterministic modeling (RUSLE + DEM) computes erosion susceptibility and generates a candidate-zone mask.
▸ Índices topográficos (TWI, SPI, slope-area) refinan las zonas candidatas con criterios físicamente fundamentados.
▸ Topographic indices (TWI, SPI, slope-area) refine candidate zones using physically grounded criteria.
▸ Anotación humana guiada — los anotadores confirman presencia real de erosión solo dentro de las zonas candidatas. Reducción de esfuerzo: 50–80%.
▸ Guided human annotation — annotators confirm actual erosion presence only within candidate zones. Effort reduction: 50–80%.
▸ Objetivos de etiquetado: cárcavas >10 m y zonas de erosión laminar, en múltiples regiones.
▸ Labeling targets: gullies >10 m and sheet erosion zones, across multiple regions.
▸ Publicación abierta: protocolo de etiquetado, métricas de acuerdo entre anotadores y herramientas, todo liberado públicamente.
▸ Open release: labeling protocol, inter-annotator agreement metrics and tools, all released publicly.

Stack de datos y modelos

▸ Sentinel-2 (10 m óptico) — base de etiquetado visual e imagen multiespectral de alta resolución.
▸ Sentinel-2 (10 m optical) — visual labeling base and high-resolution multispectral imagery.
▸ ALOS PALSAR DEM (12,5 m) — modelo digital de elevación para RUSLE y cálculo de índices topográficos.
▸ ALOS PALSAR DEM (12.5 m) — digital elevation model for RUSLE and topographic index computation.
▸ Sentinel-1 SAR (10 m, opcional) — modalidad de radar para enriquecer el dataset multimodal.
▸ Sentinel-1 SAR (10 m, optional) — radar modality to enrich the multi-modal dataset.
▸ Google Earth Engine — acceso y procesamiento de todos los datos satelitales en la nube.
▸ Google Earth Engine — cloud-based access and processing of all satellite data.
▸ Arquitecturas objetivo: DeepLabV3+, U-Net, SAM — los modelos de segmentación que el dataset habilita por primera vez de forma reproducible.
▸ Target architectures: DeepLabV3+, U-Net, SAM — the segmentation models the dataset enables reproducibly for the first time.

¿Por qué importa?

Cada modelo de deep learning publicado para detección de erosión fue entrenado con datos privados e irreproducibles.
El estándar dominante, RUSLE, predice susceptibilidad, no presencia real, y sus predicciones se desvían de mediciones en campo por factores de 0,04× a 8×; solo el 41% de los estudios validan sus resultados.
La detección por deep learning de cárcavas, erosión en masa y erosión laminar requiere etiquetas confirmadas visualmente, no predicciones deterministas.
Soil SaveR es la primera infraestructura de datos que hace posible entrenar y comparar modelos de segmentación de erosión de forma abierta y reproducible, combinando 10 fuentes de datos distintas.

¿Quieres colaborar o usar el dataset?

Buscamos colaboraciones de investigación, anotadores expertos y equipos que quieran entrenar o validar modelos de detección de erosión con datos abiertos y reproducibles.

Contáctanos →

La erosión no es solo un problema ambiental

Erosion is not just an environmental problem

Un gap en los datos que limita lo que podemos aprender.

A data gap that limits what we can learn.

Así se ve la erosión desde el espacio

This is what erosion looks like from space

Cómo construimos el dataset

How we build the dataset

El pipeline híbrido

The hybrid pipeline

Stack de datos y modelos

Data & model stack

¿Por qué importa?

Why does it matter?

¿Quieres colaborar o usar el dataset?

Want to collaborate or use the dataset?