Capturar mucho, conservar poco, entender profundo
La política de retención que usamos en FUVIHUB: qué datos se guardan, por cuánto tiempo, qué se resume y qué se desecha.
La tentación de cualquier producto que ingesta datos es guardar todo, "por si acaso". Es una tentación cara, insegura y poco útil. Guardar todo convierte tu DB en un lake accidental; guardar nada te deja sin memoria cuando llega la auditoría.
Nuestra regla: capturamos mucho, conservamos poco, entendemos profundo. En la práctica, eso significa:
Capturamos mucho — no rechazamos fuentes, no bloqueamos formatos raros, no pedimos que normalices antes de enviar. El motor clasifica, extrae features y deriva artefactos al momento.
Conservamos poco — pasada la ventana de retención (30 / 90 / 365 días o ilimitado en Institutional), los raw payloads se mueven a cold storage o se descartan. Los artefactos derivados (briefs, scans, audit) permanecen.
Entendemos profundo — los features extraídos son baratos de recomputar, así que no necesitamos conservar cada byte crudo para poder responder preguntas sobre el pasado.
El resultado es un sistema que ocupa una fracción de lo que ocuparía un lake ingenuo y responde más rápido. Detalles exactos por plan en `docs/final-data-storage-policy.md`.