# I Rebuilt Hermes in Claude Code (It's Ridiculously Good) **URL:** https://youtu.be/wdc1OFWDxlU?si=0AqRf8_0stcSKrTi **Durata:** 12:56 **Tags:** @work @growth @project --- ## TL;DR Hermes e un sistem agentic cu 40k stele GitHub în 46 de zile — rapid de adoptat, dar vine cu costuri ascunse. Autorul a ales să **reconstruiască doar piesele relevante din Hermes** în propriul setup Claude Code, în loc să instaleze ceva off-the-shelf. Concluzia: mai lent la start, dar infinit mai scalabil și mai ușor de înțeles și reparat. Extrem de relevant pentru Echo Core — confirmă că abordarea ta (custom, modular, controlat) e corectă strategic. --- ## Puncte cheie **1. Cele 3 costuri ascunse ale sistemelor off-the-shelf (OpenClaw/Hermes)** - **Moștenești asumpții pe care nu le-ai ales** — self-learning loop-ul Hermes nu are validare externă; modelul se autoevaluează (grade your own homework), poate suprascrie silențios skill-uri bune cu versiuni mai slabe - **Nu poți repara ce nu înțelegi** — OpenClaw: 200+ vulnerabilități identificate, 386 pachete malițioase descoperite de un cercetător de securitate - **Nu scalează pe business** — Hermes e proiectat pentru un singur client/brand; pentru agenții/multi-client trebuie instalări separate, fiecare cu propria memorie **2. Identity layer** - Hermes: `memory.md` + `user.md` injectate la fiecare conversație — simplu și eficace - Limitare: nu poți comuta între clienți/branduri fără instalări separate - Soluție custom: folder per client cu `brand voice`, `ICP`, `visual identity` + skills **shared** între toți clienții dintr-o singură instalare **3. Memory system** - Hermes: autosave + summarize la fiecare turn, injectare în conversație (cap ~1300 tokens), recall prin **keyword search** — slab pentru memorie pe termen lung - Soluție custom: același pattern de injectare (recent memory MD), dar recall prin **semantic search** (embeddings / mem search) — găsești informații după sens, nu după cuvinte exacte **4. Self-learning loop — controversat** - Hermes creează automat un skill nou după fiecare task — rapid la start - Problemă la scală: după 10-20 skill-uri, ajungi cu 15 versiuni ale aceluiași lucru (LinkedIn post V1, V2, V3...), greu de menținut - **Soluție custom: skill systems modulare** — fiecare skill face un singur lucru, stă într-un singur loc, se actualizează într-un singur loc; un skill system le înlănțuiește în ordinea corectă - Când vocea brandului se schimbă: un singur fișier de actualizat, toate sistemele trag din el **5. Concluzie strategică** - Hermes: mai rapid la start - Custom: mai rapid la a 10-a, 100-a iterație — fiecare strat e vizibil, editabil, reutilizabil - Alegerea depinde de context; nu există răspuns universal --- ## Citate relevante > "You can't fix what you don't understand underneath." > "The same model that writes the skill is also the sole judge of its correctness." > "When your brand voice shifts, you've got like 15 places to go and update." > "Hermes is faster to start, but your own setup is actually going to be faster to scale." --- ## Idei acționabile pentru Echo Core - [ ] **Skill systems modulare** — Echo are deja o structură similară (personality/*.md, tools separate). Verifică dacă skill-urile noi (pauze respirație, coaching etc.) urmează pattern-ul modular sau acumulează duplicat - [ ] **Semantic recall confirmat corect** — Echo folosește deja Ollama all-minilm embeddings pentru memory search semantic. Asta e exact ce autorul recomandă față de Hermes keyword search. Confirmăm că arhitectura e solidă. - [ ] **Validare externă pentru self-improvement** — Ralph scrie cod autonom; reviewul vine din skills gstack (/qa, /review). Dacă vrei un self-learning loop pentru Echo, adaugă un pas de validare externă (teste, comparare cu versiunea anterioară) înainte de a accepta skill-ul nou. --- *Salvat: 2026-05-30*