La erosión es visible desde el espacio.
Los datos para estudiarla, aún no.
Un gap en los datos que
limita lo que podemos aprender.
A data gap that limits
what we can learn.
Los métodos de deep learning para detección de erosión han mostrado resultados prometedores, pero la ausencia de datos públicos dificulta comparar, reproducir o mejorar esos modelos: de 15 artículos revisados, solo 2 comparten datos accesibles, y ambos cubren una única región y un único sensor. Soil SaveR es un intento de empezar a cerrar esa brecha, proponiendo una metodología para generar un dataset etiquetado, público, multimodal y multi-región para detección de erosión desde imágenes satelitales. La metodología combina modelado determinista (RUSLE + índices topográficos del DEM) para acotar automáticamente las zonas candidatas, con verificación visual humana sobre imágenes Sentinel-2, buscando que las etiquetas estén a la vez físicamente fundamentadas y visualmente confirmadas.
solo 2 con datos públicos
Sentinel-2
de etiquetado
de erosión previos
Así se ve la erosión desde el espacio — revelada al desplazarse
This is what erosion looks like from space — revealed as you scroll
Patones, Madrid · El mismo territorio en 1956 y 2025. Identifica los rasgos de erosión que guían nuestro proceso de etiquetado.
Cómo construimos el dataset
How we build the dataset
El pipeline híbrido
The hybrid pipeline
- ▸ Modelado determinista (RUSLE + DEM) calcula susceptibilidad a la erosión y genera una máscara de zonas candidatas.
- ▸ Deterministic modeling (RUSLE + DEM) computes erosion susceptibility and generates a candidate-zone mask.
- ▸ Índices topográficos (TWI, SPI, slope-area) refinan las zonas candidatas con criterios físicamente fundamentados.
- ▸ Topographic indices (TWI, SPI, slope-area) refine candidate zones using physically grounded criteria.
- ▸ Anotación humana guiada — los anotadores confirman presencia real de erosión solo dentro de las zonas candidatas. Reducción de esfuerzo: 50–80%.
- ▸ Guided human annotation — annotators confirm actual erosion presence only within candidate zones. Effort reduction: 50–80%.
- ▸ Objetivos de etiquetado: cárcavas >10 m y zonas de erosión laminar, en múltiples regiones.
- ▸ Labeling targets: gullies >10 m and sheet erosion zones, across multiple regions.
- ▸ Publicación abierta: protocolo de etiquetado, métricas de acuerdo entre anotadores y herramientas, todo liberado públicamente.
- ▸ Open release: labeling protocol, inter-annotator agreement metrics and tools, all released publicly.
Stack de datos y modelos
Data & model stack
- ▸ Sentinel-2 (10 m óptico) — base de etiquetado visual e imagen multiespectral de alta resolución.
- ▸ Sentinel-2 (10 m optical) — visual labeling base and high-resolution multispectral imagery.
- ▸ ALOS PALSAR DEM (12,5 m) — modelo digital de elevación para RUSLE y cálculo de índices topográficos.
- ▸ ALOS PALSAR DEM (12.5 m) — digital elevation model for RUSLE and topographic index computation.
- ▸ Sentinel-1 SAR (10 m, opcional) — modalidad de radar para enriquecer el dataset multimodal.
- ▸ Sentinel-1 SAR (10 m, optional) — radar modality to enrich the multi-modal dataset.
- ▸ Google Earth Engine — acceso y procesamiento de todos los datos satelitales en la nube.
- ▸ Arquitecturas objetivo: DeepLabV3+, U-Net, SAM — los modelos de segmentación que el dataset habilita por primera vez de forma reproducible.
- ▸ Target architectures: DeepLabV3+, U-Net, SAM — the segmentation models the dataset enables reproducibly for the first time.
¿Por qué importa?
Why does it matter?
Cada modelo de deep learning publicado para detección de erosión fue entrenado con datos privados e irreprocucibles. El modelo RUSLE, el estándar dominante, predice susceptibilidad —no presencia real—, y sus predicciones se desvían de mediciones en campo por factores de 0,04× a 8×; solo el 41% de los estudios que lo usan validan sus resultados. La detección por deep learning de cárcavas, erosión en masa y erosión laminar requiere etiquetas confirmadas visualmente, no predicciones deterministas. Soil SaveR es la primera infraestructura de datos que hace posible entrenar y comparar modelos de segmentación de erosión de forma abierta y reproducible.
¿Quieres colaborar
o usar el dataset?
Want to collaborate
or use the dataset?
Buscamos colaboraciones de investigación, anotadores expertos y equipos que quieran entrenar o validar modelos de detección de erosión con datos abiertos y reproducibles.
Contáctanos →