# Pi is INCREDIBLE - Building a Custom Coding Agent Live **Sursa:** https://www.youtube.com/live/lK9o5Wu2upU?si=fHwpJVc2-iDKU2kv **Data:** 2026-05-16 **Creator:** Cole Medin **Format:** Video (~96:20 min) **Tags:** @coding @ai-tools @harness-engineering --- ## TL;DR Cole Medin explorează **Pi** — un coding agent minimal și open source pe care îl customizezi tu ("there are many coding agents, but this one is yours"). Live stream de 96 min: configurează Pi cu **Kimi K2.6** ($40/lună) ca alternativă la rate limit-urile Anthropic, instalează extensii (web access, status line, permission gates), și construiește o extensie proprie "Archon Dispatch" pentru a gestiona workflow-uri ARCON din Pi. Lecție cheie: **harness-ul contează mai mult decât modelul** — Kimi e ieftin și decent, dar dezamăgitor la detalii; soluția este să combini modele slabe (working) cu modele puternice (reviewer/planner). --- ## Note esențiale ### Ce este Pi - **Coding agent minimal, open source** — fundație pe care o construiești tu, nu un tool bloated gata de folosit - Tagline: *"There are many agent harnesses, but this one is yours"* - Pi se adaptează la workflow-ul tău, nu invers - Mai rapid decât Claude Code/Codex pentru cereri simple (e mai mic) - **PI = Prime Intellect** ### Modele suportate - Codex subscription (fără rate limit Anthropic) - **Kimi K2.6** prin API key ($40/lună, 262k context, 5h limit + weekly limit) - Minimax, Qwen prin OpenRouter - GitHub Copilot - Anthropic subscription — **ÎMPOTRIVA ToS Anthropic** (nu recomanda) - Kimi prin subscripție consumă quota subscripției, nu per-token ### Extensii Pi (marketplace NPM) - **pi-web-access** — web search, URL fetch, GitHub clone, PDF, YouTube - **pi-agent-extension** — pachet complet: status line, permission gates, slow mode, notify, questionnaire, stash - *Status line*: footer 2 linii cu model/context/tokens - *Permission gate*: aprobare comenzi periculoase (echivalentul hooks din Claude Code) - *Slow mode*: approve/reject diff înainte să scrie pe disc - *Questionnaire*: UI cu tabs pentru întrebări LLM (similar AskUser din Claude Code) - **Pi Advisor** (extensie separată): al doilea model mai puternic face review înainte de acțiune — working model (Kimi) + reviewer (Opus) - Marketplace nemoderat — verifică numărul de instalări înainte să instalezi ### Skills în Pi - Pi încarcă skills din `~/.agents/skills/` (nu `~/.claude/skills/`) - Poți configura `settings.json` să încarce din orice folder (inclusiv `~/.claude/skills/`) - Pi are meta-înțelegere — știe să-și modifice propria configurație ### Comenzi utile Pi - `/reload` — reîncarcă extensii, skills, config (fără restart) - `/new` — sesiune nouă - `/resume` — continuă sesiune anterioară - `/model` — schimbă modelul (nu funcționează mid-conversație fără pierderea istoricului) ### Extensia Archon Dispatch (build live) Cole a construit o extensie care transformă Pi în "control panel" pentru Archon workflows: - **Confirmation gate** — popup înainte de execuție (nume workflow, branch, preview mesaj) - **Live status line** — câte Archon workflows rulează + ultimul log - **Progress tailing** — citire log în timp real fără re-citire date vechi - **Completion loop** — la final: notificare desktop + injectare rezultat în sesiunea Pi (fără a forța un turn LLM) - Bug persistent: output-ul workflow-ului nu se injecta corect în sesiune (Kimi nu a reușit să-l fixeze complet) ### Filozofia harness engineering - **Harness-ul > modelul** pentru rezultate bune la AI coding - Modelele puternice (Opus) → planning și review - Modelele ieftine (Kimi, Qwen, Minimax) → research și implementare - Pattern recomandat: **working model (Kimi) + advisor/reviewer model (Opus)** - Kimi K2.6: bun și ieftin, dar dezamăgitor la detalii fine; tinde să se blocheze în reasoning loops - Minimax M2.7: similar, se blochează ocazional ### Modele locale de interes - **Qwen 3.6** (27B/35B, 3B active params MoE) — rulează pe 2x RTX 3090 - DeepSeek V4 Flash — 284B total, 13B active, foarte ieftin ### Pi vs alte tools | Tool | Pro | Con | |------|-----|-----| | Pi | minimal, customizabil, orice model, rapid | mai slab out-of-the-box, necesită setup | | Claude Code | cel mai puternic OOB | nu e open source, rate limits Anthropic | | Codex | open source, ok | codebase masiv, greu de customizat | | Jcode | cel mai rapid (benchmarks) | focusat pe viteză, nu calitate | ### Integrare Pi + ARCON - ARCON suportă Pi ca provider (alături de Claude, Codex) - Skill-ul ARCON funcționează în Pi după configurare `settings.json` - Idee viitoare: Archon workflow care construiește extensii Pi automat ### Observații Anthropic (context) - Weekly rate limit înrăutățit — Cole a consumat limita săptămânală în 3 zile - Parteneriatul SpaceX a îmbunătățit doar limita de 5h, nu și pe cea weekly - Direcție industrie: modele scumpe doar pentru planning; implementare pe modele mai mici