4.9 KiB
Pi is INCREDIBLE - Building a Custom Coding Agent Live
Sursa: https://www.youtube.com/live/lK9o5Wu2upU?si=fHwpJVc2-iDKU2kv Data: 2026-05-16 Creator: Cole Medin Format: Video (~96:20 min) Tags: @coding @ai-tools @harness-engineering
TL;DR
Cole Medin explorează Pi — un coding agent minimal și open source pe care îl customizezi tu ("there are many coding agents, but this one is yours"). Live stream de 96 min: configurează Pi cu Kimi K2.6 ($40/lună) ca alternativă la rate limit-urile Anthropic, instalează extensii (web access, status line, permission gates), și construiește o extensie proprie "Archon Dispatch" pentru a gestiona workflow-uri ARCON din Pi. Lecție cheie: harness-ul contează mai mult decât modelul — Kimi e ieftin și decent, dar dezamăgitor la detalii; soluția este să combini modele slabe (working) cu modele puternice (reviewer/planner).
Note esențiale
Ce este Pi
- Coding agent minimal, open source — fundație pe care o construiești tu, nu un tool bloated gata de folosit
- Tagline: "There are many agent harnesses, but this one is yours"
- Pi se adaptează la workflow-ul tău, nu invers
- Mai rapid decât Claude Code/Codex pentru cereri simple (e mai mic)
- PI = Prime Intellect
Modele suportate
- Codex subscription (fără rate limit Anthropic)
- Kimi K2.6 prin API key ($40/lună, 262k context, 5h limit + weekly limit)
- Minimax, Qwen prin OpenRouter
- GitHub Copilot
- Anthropic subscription — ÎMPOTRIVA ToS Anthropic (nu recomanda)
- Kimi prin subscripție consumă quota subscripției, nu per-token
Extensii Pi (marketplace NPM)
- pi-web-access — web search, URL fetch, GitHub clone, PDF, YouTube
- pi-agent-extension — pachet complet: status line, permission gates, slow mode, notify, questionnaire, stash
- Status line: footer 2 linii cu model/context/tokens
- Permission gate: aprobare comenzi periculoase (echivalentul hooks din Claude Code)
- Slow mode: approve/reject diff înainte să scrie pe disc
- Questionnaire: UI cu tabs pentru întrebări LLM (similar AskUser din Claude Code)
- Pi Advisor (extensie separată): al doilea model mai puternic face review înainte de acțiune — working model (Kimi) + reviewer (Opus)
- Marketplace nemoderat — verifică numărul de instalări înainte să instalezi
Skills în Pi
- Pi încarcă skills din
~/.agents/skills/(nu~/.claude/skills/) - Poți configura
settings.jsonsă încarce din orice folder (inclusiv~/.claude/skills/) - Pi are meta-înțelegere — știe să-și modifice propria configurație
Comenzi utile Pi
/reload— reîncarcă extensii, skills, config (fără restart)/new— sesiune nouă/resume— continuă sesiune anterioară/model— schimbă modelul (nu funcționează mid-conversație fără pierderea istoricului)
Extensia Archon Dispatch (build live)
Cole a construit o extensie care transformă Pi în "control panel" pentru Archon workflows:
- Confirmation gate — popup înainte de execuție (nume workflow, branch, preview mesaj)
- Live status line — câte Archon workflows rulează + ultimul log
- Progress tailing — citire log în timp real fără re-citire date vechi
- Completion loop — la final: notificare desktop + injectare rezultat în sesiunea Pi (fără a forța un turn LLM)
- Bug persistent: output-ul workflow-ului nu se injecta corect în sesiune (Kimi nu a reușit să-l fixeze complet)
Filozofia harness engineering
- Harness-ul > modelul pentru rezultate bune la AI coding
- Modelele puternice (Opus) → planning și review
- Modelele ieftine (Kimi, Qwen, Minimax) → research și implementare
- Pattern recomandat: working model (Kimi) + advisor/reviewer model (Opus)
- Kimi K2.6: bun și ieftin, dar dezamăgitor la detalii fine; tinde să se blocheze în reasoning loops
- Minimax M2.7: similar, se blochează ocazional
Modele locale de interes
- Qwen 3.6 (27B/35B, 3B active params MoE) — rulează pe 2x RTX 3090
- DeepSeek V4 Flash — 284B total, 13B active, foarte ieftin
Pi vs alte tools
| Tool | Pro | Con |
|---|---|---|
| Pi | minimal, customizabil, orice model, rapid | mai slab out-of-the-box, necesită setup |
| Claude Code | cel mai puternic OOB | nu e open source, rate limits Anthropic |
| Codex | open source, ok | codebase masiv, greu de customizat |
| Jcode | cel mai rapid (benchmarks) | focusat pe viteză, nu calitate |
Integrare Pi + ARCON
- ARCON suportă Pi ca provider (alături de Claude, Codex)
- Skill-ul ARCON funcționează în Pi după configurare
settings.json - Idee viitoare: Archon workflow care construiește extensii Pi automat
Observații Anthropic (context)
- Weekly rate limit înrăutățit — Cole a consumat limita săptămânală în 3 zile
- Parteneriatul SpaceX a îmbunătățit doar limita de 5h, nu și pe cea weekly
- Direcție industrie: modele scumpe doar pentru planning; implementare pe modele mai mici