2.2 KiB
2.2 KiB
description, argument-hint
| description | argument-hint |
|---|---|
| Show backtest statistics for data/jurnal.csv (overall, per-Set, per-calitate, per-instrument with Wilson + bootstrap CIs). --calibration shows P4 mismatch report. | [--calibration] [--seed N] |
/stats — backtest statistics
Rulează scripts/stats.py și afișează raportul.
Arguments
--calibration(flag) — afișează raportul P4 (mismatch field-by-field pe perechimanual_calibration↔vision_calibrationjoin-uite pescreenshot_file).--seed N(opțional) — seed pentru bootstrap RNG (default fără seed → output ne-determinist între run-uri). Folosește când vrei reproducibilitate.
Default (fără flag-uri): backtest stats — overall + per-Set + per-calitate + per-instrument WR, expectancy, Wilson 95% CI pe WR, bootstrap 95% CI pe expectancy.
Workflow
-
Construiește comanda:
python scripts/stats.py [--calibration] [--seed N]--csv data/jurnal.csve default-ul scriptului — nu îl pasezi. -
Rulează prin Bash tool. Output-ul vine pe stdout în UTF-8.
-
Afișează output-ul as-is către user. Nu reformata, nu re-rezuma, nu interpreta. Scriptul are deja format ales (tabel + secțiuni text).
-
Interpretare scurtă (max 3 propoziții) DACĂ user-ul cere explicit sau dacă observi ceva ce merită menționat:
- În modul backtest: Set-uri cu N ≥ 40 și Wilson lower bound > 50% → candidat pentru GO LIVE (vezi
STOPPING_RULE.md). - În modul
--calibration: dacă există ≥10 perechi și mismatch rate > 10% pe câmpuri core (entry/sl/tp0/1/2/outcome_path/max_reached/directie) → P4 FAIL, vision agent are nevoie de fix (.claude/agents/m2d-extractor.md).
- În modul backtest: Set-uri cu N ≥ 40 și Wilson lower bound > 50% → candidat pentru GO LIVE (vezi
-
NU edita CSV. NU regenera MD (citire pură).
Reguli
- Read-only. Această comandă nu scrie nimic.
- Output-ul scriptului e ground truth — nu inventezi numere.
calitatee descriptor biased (post-outcome) — veziSTOPPING_RULE.md§3 — raportul îl afișează informational only. NU sugerezi user-ului să foloseascăcalitateca filtru pentru GO LIVE.- Pentru calibration P4: minimum 10 perechi pentru ca verdictul să aibă sens. Sub 10 perechi → raportezi "insuficient pentru P4 — continuă să acumulezi calibrare".