Metodología auditable

Cómo predecimos 72 horas antes

Tres capas que juntas dan la ventana operativa: ensemble de 4 fuentes meteorológicas para lluvia (OpenMeteo + NOAA GFS + ECMWF IFS + WRF 4km SMN, voting ≥3-de-4 para gating), modelos LSTM por estación para nivel del agua hasta 72h, y detección multi-señal (umbral oficial PNA, z-score adaptativo, rate-of-change, NDWI satelital, upstream lag-adjusted). Cada predicción expone su método; cada alerta se valida contra eventos reales — precisión pública en /fiabilidad.

Alimentado por 20 fuentes integradas: estaciones INA, Open-Meteo, NOAA GFS, SMN WRF 4km, GloFAS (caudal), Sentinel-2 (NDWI), CONAE (4 capas), NASA GPM/FIRMS/IMERG, GWIS/Copernicus, ACUMAR, PNA, INDEC, GCBA, eBird y reportes ciudadanos.

1.899

Estaciones INA

54

Estaciones Open-Meteo

50

Caudal GloFAS

Puntos Sentinel-2

Zonas monitoreadas

0

Alertas activas

Pipeline de datos

1. Ingesta
Fuentes de datos

INA — Instituto Nacional del Agua

Niveles hidrométricos y caudal cada 6 horas. API pública: alerta.ina.gob.ar

Sentinel-2 (ESA/Copernicus)

Imágenes multiespectrales cada 5 días. NDWI para calidad del agua. Resolución 10m.

ACUMAR / COMIREC

Zonas contaminadas, basurales, calidad de agua. Datos oficiales de cuenca. ACUMAR también provee caudal histórico del Riachuelo.

CONAE — 4 capas satelitales

Inundaciones, estatus hídrico, calidad del aire (NO₂), precipitación eléctrica.

INDEC Censo 2022

Población por departamento. 37 partidos del AMBA con datos oficiales.

Open-Meteo — Pronóstico 72h

Precipitación, temperatura, presión, humedad del suelo, viento. 207 estaciones con forecast de 3 días para alerta preventiva.

GloFAS (Copernicus)

Pronóstico de caudal fluvial. Descarga media, máxima y percentiles para 30 días. Alimenta el modelo de propagación.

NASA FIRMS — Focos de calor

Detección satelital de incendios cerca de cuencas. Satélite VIIRS, actualización near-real-time.

NASA GPM — Lluvia satelital

Precipitación calibrada por satélite (IMERG). Complementa estaciones terrestres en zonas sin cobertura.

GWIS/Copernicus — Peligro de incendio

Pronóstico de peligro de incendio forestal (FWI) hasta 10 días. Rayos y humo PM2.5. ECMWF vía Copernicus.

eBird — Biodiversidad

Red global de observación de aves. Hotspots y especies como indicador de salud ecosistémica de las cuencas.

SMN — SYNOP (vía OGIMET/WMO)

Precipitación real de pluviómetros del Servicio Meteorológico Nacional. Ventanas de 1h y 3h para tormentas convectivas.

SMN — WRF 4km (AWS S3)

Pronóstico de precipitación a 4km de resolución del modelo WRF del SMN. Resuelve convección explícitamente — clave para tormentas urbanas intensas. 72h horizonte, 4 runs/día.

Reportes ciudadanos

Cualquier persona puede reportar contaminación con foto y GPS. Los reportes alimentan el mapa y los modelos de riesgo.

2. Procesamiento
Modelos de detección

Umbral absoluto

Si el nivel supera umbrales publicados por el INA → alerta inmediata. Funciona desde el día 1 sin histórico.

Anomalía estadística (z-score adaptativo)

Compara nivel vs promedio histórico. Umbral se adapta por lluvia: 2.5σ normal, 3.0σ con lluvia moderada, 3.5σ con lluvia intensa. Evita falsos positivos.

Rate-of-change (dh/dt)

Si el nivel sube más de 10cm/hora → alerta de crecida rápida. Detecta eventos ANTES del pico.

NDWI satelital

Índice de turbidez desde Sentinel-2. Si NDWI cae bajo 0.1 → posible derrame o contaminación. Actualización cada 5 días (sin nubes).

Pronóstico de lluvia (72h)

Anticipa crecidas ANTES de que llueva. Si el ensemble de 4 fuentes coincide en >50mm/24h aguas arriba (≥3 de 4 modelos) → alerta preventiva con ETA estimado.

Detección + pronóstico de incendios

NASA FIRMS detecta focos activos. GWIS pronostica peligro a 10 días (FWI). Combinados: detección + predicción.

Alertas multi-señal con IA

Combina 7 señales (lluvia, upstream, pronóstico, suelo, presión, GloFAS, tendencia) para anticipar crecidas. Incluye origen geográfico (ej: sur de Brasil → Itaipú → Yacyretá).

Contaminación por desborde cloacal (CSO)

Cuando llueve >30mm en cuencas urbanas, los sistemas pluvio-cloacales desbordan descargando efluentes sin tratar. Alerta automática con ventanas de 1h y 3h para tormentas convectivas.

3. Respuesta
Alertas y predicción

Alertas automáticas

Email a suscriptores cuando se detecta una anomalía. Topbar en vivo en el sitio. 4 niveles: info, precaución, alerta, emergencia.

Modelo de propagación

Simula el recorrido de contaminantes río abajo. Calcula ETA a puntos de referencia usando caudal real del INA. 4 escenarios + modo personalizado.

Predicción LSTM + ONNX (Deep Learning)

Red neuronal LSTM v3/v6 con 11 features (nivel, lluvia actual, temperatura, presión, humedad de suelo, evapotranspiración, caudal, codificación cíclica de hora/día). 38 estaciones con modelo entrenado y activo (Cuenca del Plata + Patagonia + Catamarca). Selector automático elige por estación y horizonte el método con menor MAE histórico (LSTM, persistencia o tendencia estadística) — la persistencia gana en río calmo (~2-5 cm a 6-24 h), el LSTM aporta donde hay dinámica real (~5-7 cm a 24 h en estaciones urbanas medidas en producción). Predice 24/48/72 h. Alertas tempranas automáticas cuando el nivel predicho supera umbrales PNA. Ver métricas de precisión en vivo →

Contexto geográfico

Cada punto de impacto se enriquece con población real (INDEC Censo 2022) del departamento más cercano.

Deslizamientos — modelo experimental

Score 0-100 por estación combinando pendiente DEM SRTM 30m + lluvia 24 h + lluvia antecedente 7 días + humedad de suelo Open-Meteo. Cobertura andina: 68 estaciones con pendiente ≥10° (NOA + Cuyo + Patagonia). Validado retrospectivamente contra catálogo curado de 17 eventos AR históricos (Tartagal 2009, Comodoro 2017, Volcán 2017, Tafí del Valle 2026, etc.). v1 sin alcanzar el umbral de alerta — recalibración pendiente. Ver backtest →

Pronóstico de incendio — Hot-Dry-Windy

Score 0-100 derivado del Hot-Dry-Windy Index (Srock 2018, USFS) — VPD × velocidad de viento, con boost de 30% cuando hay sequía antecedente (lluvia 7d < 5 mm). NO es detección de fuego (eso lo hace NASA FIRMS retrospectivamente, ya integrado), es pronóstico de condiciones meteorológicas favorables. Backtest contra 912 detecciones FIRMS reales: HDW v1 calibrado para incendios extremos no alcanza el umbral en quemas agrícolas low-intensity. Detector dormant esperando temporada extrema. Ver backtest →

Viento extremo — pronóstico Open-Meteo

Detector v1 (2026-05-01) que dispara cuando el pronóstico Open-Meteo de viento sostenido a 10m AGL excede 60 km/h (precaución), 80 km/h (alerta) o 110 km/h (evacuación) en las próximas 24h. Cobertura nacional por construcción — el grid global aplica a toda Argentina. Pensado para Patagonia (Comodoro Rivadavia, Río Gallegos), Sudestada en el Río de la Plata (BA-CABA) y Zonda en Cuyo (Mendoza/San Juan). Disclosure: son forecasts, no medición de anemómetro local.

Caudal extremo — GloFAS tier-2

Detector v1 (2026-05-01, recalibrado 2026-05-02) que cruza el pronóstico ensemble de GloFAS v4 (~5 km global) contra el percentil 95 de los 60 días anteriores en la misma estación. Severidad por ratio: 2.0× = precaución, 3.0× = alerta, 5.0× = evacuación. Floors absolutos (peak ≥ 50 m³/s, baseline ≥ 0.5 m³/s) evitan falsos positivos en arroyos chicos. Complementa el LSTM y los umbrales PNA fuera de la Cuenca del Plata. Disclosure: modelo global de baja resolución relativa, no reemplaza al medidor de río.

Tormenta convectiva severa — CAPE + SHEAR + Lifted Index

Detector v1 (2026-05-02) que cruza CAPE (Convective Available Potential Energy), Lifted Index y wind shear 10–180m del pronóstico Open-Meteo para identificar condiciones favorables a tornado, supercelda y granizo grande. Severidad por banda atmosférica: precaución (CAPE>1000 + LI<-2), alerta (CAPE>2000 + LI<-4 = supercelda probable), evacuación (CAPE>2500 + shear>15 m/s = ambiente tornado-favorable). Cobertura nacional. Pensado para tornado La Plata 2024, granizo Mendoza recurrente, supercelda Tandil. Disclosure: shear 10-180m es proxy del 0-6 km bulk shear de la práctica meteo (v2 hará pull pressure-level completo).

Lluvia extrema — ensemble multi-fuente

Detector v2 (2026-05-02) que cruza pronósticos de lluvia de 4 modelos meteorológicos (OpenMeteo + ECMWF + GFS + WRF-SMN 4 km) y dispara cuando ≥3 de 4 coinciden en más de 50 mm/24 h o más de 100 mm/72 h. Agrupa las observaciones por celdas lat/lon de 0.25° (~28 km) para poolear estaciones cercanas de distintos scrapers — cobertura nacional efectiva en las 24 jurisdicciones (incluye Jujuy, Santiago del Estero, Córdoba, La Pampa y Tierra del Fuego, donde no hay PNA). Disclosure: son pronósticos de modelo, no medición de pluviómetro local.

Contaminación plástica

El problema

El 70% de la basura del Río Paraná son plásticos según el estudio del CONICET (Bioestación Paraná, publicado en Science of the Total Environment). La Cuenca Matanza-Riachuelo tiene 4.509 fuentes de contaminación industrial documentadas por ACUMAR. Hoy monitoreamos zonas.

Cómo medimos

  • Zonas oficiales — ACUMAR, COMIREC y CONICET documentan la ubicación y severidad de basurales y vertederos
  • Reportes ciudadanos — cualquier persona reporta contaminación con foto, GPS y clasificación del tipo de residuo
  • Turbidez satelital (NDWI) — Sentinel-2 detecta cambios en la calidad del agua que pueden indicar vertidos o arrastre de residuos
  • Modelo de arrastre — calculamos cuánta contaminación se moviliza río abajo cuando sube el caudal

Qué generamos

Índice de Riesgo por zona

Combina severidad + toneladas de plástico para rankear las zonas más críticas. Se actualiza con cada reporte nuevo.

Prioridad de limpieza

Ranking de dónde intervenir primero basado en: severidad (35%) + plásticos (35%) + población cercana (30%).

Riesgo de arrastre post-lluvia

Estimación de cuántas toneladas se movilizan río abajo en caso de crecida. Basado en basurales documentados + caudal actual.

Exposición poblacional

Cuántas personas viven junto a ríos contaminados. Cruce de INDEC Censo 2022 con zonas de ACUMAR.

Modelo de propagación

Qué calcula

Dado un punto de origen en un río y un caudal, el modelo calcula cuánto tarda el agua (y lo que arrastra) en llegar a cada punto de referencia río abajo.

Datos de entrada

  • Caudal real — medido por estaciones INA (prioridad), o estimado si no hay dato actual
  • 12 segmentos de río — Riachuelo (6), Reconquista (4), Río de la Plata (2) con geometría real
  • Velocidad estimada — a partir del caudal y geometría promedio del cauce
  • Población real — INDEC Censo 2022, 37 departamentos

Escenarios disponibles

ActualCaudal medido por INA
Lluvia moderadaCaudal 2x — lluvia de 30mm
Lluvia fuerteCaudal 3x — tormenta intensa
Crecida extremaCaudal 5x — evento excepcional
PersonalizadoElegir caudal y punto de origen

Limitaciones

  • • ETAs son aproximados (±15-35% según fuente de datos)
  • • No incluye datos de altimetría ni cotas de inundación
  • • No modela dispersión ni dilución de contaminantes
  • • Velocidad basada en geometría promedio, no secciones reales
  • • No reemplaza modelos hidráulicos profesionales (HEC-RAS)

Predicción de niveles con LSTM

Cómo funciona

Usamos una red neuronal LSTM (Long Short-Term Memory) entrenada con datos históricos del INA para predecir niveles de agua a 24, 48 y 72 horas (los horizontes 6h/12h salen del fallback estadístico de persistencia/tendencia). El modelo aprende patrones temporales (mareas, estacionalidad, tendencias) y genera predicciones con intervalo de confianza.

Arquitectura del modelo

  • Input — Últimos 7 días de mediciones (28 lecturas cada 6h)
  • Features — Nivel de agua normalizado + encoding cíclico de hora y día del año (sin/cos)
  • LSTM 64 + 32 unidades — Dos capas con dropout 0.35 para evitar overfitting (config v6)
  • Output — 3 horizontes LSTM (24h, 48h, 72h) con banda de confianza al 95%. 6h/12h se sirven con fallback estadístico

Estaciones monitoreadas

38 estaciones con LSTM activo en producción sobre los ríos Iguazú, Uruguay, Paraná Alto/Medio/Inferior, Paraguay, Río de la Plata y Delta. Métricas en vivo (MAE, NSE, MASE, recall por umbral) actualizadas cada cron en /fiabilidad.

Ejecución

  • • Entrenamiento: TensorFlow/Keras en Google Colab GPU sobre ~18 meses de histórico INA + Open-Meteo, exportado a ONNX para inferencia serverless en Vercel
  • • Inference: Cada 6 horas en el cron de Vercel
  • • Modelos almacenados en Supabase Storage (~200KB c/u)
  • • Alertas automáticas si la predicción supera umbrales INA publicados
  • • Fallback estadístico transparente: si no hay modelo ONNX entrenado para una estación, se usa regresión lineal + estacionalidad. El método se indica en cada predicción (LSTM u Estadístico)
  • • Re-entrenamiento periódico para adaptarse a cambios estacionales

Calidad del agua satelital (NDWI)

Qué mide

El NDWI (Normalized Difference Water Index) se calcula combinando dos bandas de las imágenes Sentinel-2: verde (B03) e infrarrojo cercano (B08). El resultado indica la turbidez del agua — un indicador de contaminación por sedimentos, descargas industriales o efluentes cloacales.

Escala de calidad

> 0.3BuenaAgua clara
0.2 — 0.3AceptableTurbidez moderada
0.1 — 0.2RegularTurbidez elevada
0 — 0.1MalaAlta turbidez
< 0CríticaAgua muy turbia

Puntos de monitoreo

Río de la Plata — CABA, Quilmes, San Isidro
Matanza-Riachuelo — Cañuelas, González Catán, Puente Alsina, La Boca, Desembocadura
Reconquista — Moreno, San Martín, Tigre, Desembocadura
Paraná — Posadas, Corrientes, Santa Fe, Rosario, San Fernando
Luján — Mercedes, Pilar

Especificaciones técnicas

Satélite: Sentinel-2A/2B (ESA)

Resolución espacial: 10 metros

Revisita: cada 5 días

Bandas: B03 (verde, 560nm), B08 (NIR, 842nm)

Filtro de nubes: Scene Classification Layer (SCL), máximo 30%

API: Copernicus Data Space Sentinel Hub

Fuentes de datos

Frecuencia de actualización

Cada 6 horas: Niveles INA + meteorologia Open-Meteo + caudal GloFAS → predicciones LSTM → alertas → emails

Semanal: ACUMAR, puntos verdes, datos nacionales, INDEC, Sentinel-2 NDWI

Tiempo real: Reportes ciudadanos, suscripciones de alerta