Saltar a contenido

El pipeline de producción científica

El pipeline SDD (Spec-Driven Development) aplicado a papers. Cada fase tiene inputs, outputs y gates explícitos. Si un gate falla, no se avanza — se diagnostica y se corrige.

Regla fundamental

Un paper es un REPORTE de resultados computacionales/experimentales, no un ensayo de texto. Sin datos reales en data/processed/, no hay paper.

DAG completo

EXPLORE → PROPOSE → [SPEC ∥ DESIGN] → TASKS → COMPUTE → IMPLEMENT → VERIFY → FINALIZE → ARCHIVE

[SPEC ∥ DESIGN] corren en paralelo. VERIFY puede hacer loop back a IMPLEMENT (si fue estructura) o a COMPUTE (si fueron datos).

Las 9 fases

1. EXPLORE

Grep puntual de SSOT, queries Engram, novelty check (GATE). PROPOSE no arranca sin novelty report. Si el tema es DUPLICATE → 3 pivots al usuario.

2. PROPOSE

Propuesta de 1 párrafo: tema, contribución única, journal target. Aplica Challenger Protocol (supuestos, contraargumento, alternativa). El scope que se define acá es inmutable.

3. SPEC + DESIGN (paralelo)

  • SPEC: define quartile, journal, quality gates, palabras min/max, refs mínimas, secciones obligatorias.
  • DESIGN: outline IMRaD, mapeo de figuras planificadas, mapeo de refs por categoría.

4. TASKS

Descompone IMPLEMENT en 4 batches atómicos con criterios de aceptación.

5. COMPUTE (sub-fases C0-C5.5)

La fase más crítica. Sin COMPUTE, IMPLEMENT está bloqueado.

Gate Qué hace
C0 Inventario: deps + backend importa + SSOT válido
C1 Adquisición de datos (fetch_domain_data.py --verify)
C2 Ejecución del solver → escribe data/processed/
C3 Emulador de hardware (opcional, SKIP si null)
C4 Datos sintéticos complementarios (opcional, SKIP si null)
C5 Data gate duro: COMPUTE_MANIFEST.json con all_design_sources_exist: true
C5.5 Preflight estadístico (Q1/Q2 pre-IMPLEMENT, F09): power ≥ 0.80, normalidad, homocedasticidad, effect size

El preflight C5.5 corre ANTES de escribir nada (pre-registration mentality). Veredictos: VIABLE (desbloquea) / UNDERPOWERED·VIOLATIONS·INSUFFICIENT (bloquea).

6. IMPLEMENT (4 batches)

Regla de oro

Si una oración dice "the model produced X" y X no está en data/processed/, esa oración es una mentira. El Verifier la rechaza.

Pre-batch: Style Calibration (descarga 3-5 papers reales del venue, extrae patrones, guarda Style Card). Batches: B1 Methodology → B2 Results (Q1/Q2: error bars obligatorias) → B3 Discussion → B4 Abstract+Intro+Refs.

7. VERIFY

Validación completa + simulación de peer review hostil. Gates del Reviewer Simulator: Gate 0 (AI prose detection), Gate 0.90 (stats_engine validation), Gate 1 (traceability), Gate 2 (Q1/Q2 HARD BLOCK — CI/error bars, N, hipótesis test, effect size).

8. FINALIZE

Figuras finales PDF/PNG, compila PDF (compile_paper.sh --template ieee), Reviewer Simulator pass, cover letter. Sin figuras reales + PDF + Reviewer pass → ARCHIVE inválido.

9. ARCHIVE

Merge delta specs, guarda lecciones, cierra ciclo. Pregunta obligatoria al usuario: enviar / siguiente paper / otra cosa.

La escalera de publicación

Conference → Q4 → Q3 → Q2 → Q1

Cada paper hereda del anterior (datos, estructura, refs). No se saltan niveles. No se planifica Q4 mientras Conference no esté en ARCHIVE.

Ver también

Fuente canónica

Deriva de docs/shared/PIPELINE.md.