Files
echo-core/memory/kb/youtube/2026-05-16_pi-is-incredible-building-a-custom-coding-agent-li.md

4.9 KiB

Pi is INCREDIBLE - Building a Custom Coding Agent Live

Sursa: https://www.youtube.com/live/lK9o5Wu2upU?si=fHwpJVc2-iDKU2kv Data: 2026-05-16 Creator: Cole Medin Format: Video (~96:20 min) Tags: @coding @ai-tools @harness-engineering


TL;DR

Cole Medin explorează Pi — un coding agent minimal și open source pe care îl customizezi tu ("there are many coding agents, but this one is yours"). Live stream de 96 min: configurează Pi cu Kimi K2.6 ($40/lună) ca alternativă la rate limit-urile Anthropic, instalează extensii (web access, status line, permission gates), și construiește o extensie proprie "Archon Dispatch" pentru a gestiona workflow-uri ARCON din Pi. Lecție cheie: harness-ul contează mai mult decât modelul — Kimi e ieftin și decent, dar dezamăgitor la detalii; soluția este să combini modele slabe (working) cu modele puternice (reviewer/planner).


Note esențiale

Ce este Pi

  • Coding agent minimal, open source — fundație pe care o construiești tu, nu un tool bloated gata de folosit
  • Tagline: "There are many agent harnesses, but this one is yours"
  • Pi se adaptează la workflow-ul tău, nu invers
  • Mai rapid decât Claude Code/Codex pentru cereri simple (e mai mic)
  • PI = Prime Intellect

Modele suportate

  • Codex subscription (fără rate limit Anthropic)
  • Kimi K2.6 prin API key ($40/lună, 262k context, 5h limit + weekly limit)
  • Minimax, Qwen prin OpenRouter
  • GitHub Copilot
  • Anthropic subscription — ÎMPOTRIVA ToS Anthropic (nu recomanda)
  • Kimi prin subscripție consumă quota subscripției, nu per-token

Extensii Pi (marketplace NPM)

  • pi-web-access — web search, URL fetch, GitHub clone, PDF, YouTube
  • pi-agent-extension — pachet complet: status line, permission gates, slow mode, notify, questionnaire, stash
    • Status line: footer 2 linii cu model/context/tokens
    • Permission gate: aprobare comenzi periculoase (echivalentul hooks din Claude Code)
    • Slow mode: approve/reject diff înainte să scrie pe disc
    • Questionnaire: UI cu tabs pentru întrebări LLM (similar AskUser din Claude Code)
  • Pi Advisor (extensie separată): al doilea model mai puternic face review înainte de acțiune — working model (Kimi) + reviewer (Opus)
  • Marketplace nemoderat — verifică numărul de instalări înainte să instalezi

Skills în Pi

  • Pi încarcă skills din ~/.agents/skills/ (nu ~/.claude/skills/)
  • Poți configura settings.json să încarce din orice folder (inclusiv ~/.claude/skills/)
  • Pi are meta-înțelegere — știe să-și modifice propria configurație

Comenzi utile Pi

  • /reload — reîncarcă extensii, skills, config (fără restart)
  • /new — sesiune nouă
  • /resume — continuă sesiune anterioară
  • /model — schimbă modelul (nu funcționează mid-conversație fără pierderea istoricului)

Extensia Archon Dispatch (build live)

Cole a construit o extensie care transformă Pi în "control panel" pentru Archon workflows:

  • Confirmation gate — popup înainte de execuție (nume workflow, branch, preview mesaj)
  • Live status line — câte Archon workflows rulează + ultimul log
  • Progress tailing — citire log în timp real fără re-citire date vechi
  • Completion loop — la final: notificare desktop + injectare rezultat în sesiunea Pi (fără a forța un turn LLM)
  • Bug persistent: output-ul workflow-ului nu se injecta corect în sesiune (Kimi nu a reușit să-l fixeze complet)

Filozofia harness engineering

  • Harness-ul > modelul pentru rezultate bune la AI coding
  • Modelele puternice (Opus) → planning și review
  • Modelele ieftine (Kimi, Qwen, Minimax) → research și implementare
  • Pattern recomandat: working model (Kimi) + advisor/reviewer model (Opus)
  • Kimi K2.6: bun și ieftin, dar dezamăgitor la detalii fine; tinde să se blocheze în reasoning loops
  • Minimax M2.7: similar, se blochează ocazional

Modele locale de interes

  • Qwen 3.6 (27B/35B, 3B active params MoE) — rulează pe 2x RTX 3090
  • DeepSeek V4 Flash — 284B total, 13B active, foarte ieftin

Pi vs alte tools

Tool Pro Con
Pi minimal, customizabil, orice model, rapid mai slab out-of-the-box, necesită setup
Claude Code cel mai puternic OOB nu e open source, rate limits Anthropic
Codex open source, ok codebase masiv, greu de customizat
Jcode cel mai rapid (benchmarks) focusat pe viteză, nu calitate

Integrare Pi + ARCON

  • ARCON suportă Pi ca provider (alături de Claude, Codex)
  • Skill-ul ARCON funcționează în Pi după configurare settings.json
  • Idee viitoare: Archon workflow care construiește extensii Pi automat

Observații Anthropic (context)

  • Weekly rate limit înrăutățit — Cole a consumat limita săptămânală în 3 zile
  • Parteneriatul SpaceX a îmbunătățit doar limita de 5h, nu și pe cea weekly
  • Direcție industrie: modele scumpe doar pentru planning; implementare pe modele mai mici