# I Rebuilt Hermes in Claude Code (It's Ridiculously Good)

**URL:** https://youtu.be/wdc1OFWDxlU?si=0AqRf8_0stcSKrTi
**Durata:** 12:56
**Tags:** @work @growth @project

---

## TL;DR

Hermes e un sistem agentic cu 40k stele GitHub în 46 de zile — rapid de adoptat, dar vine cu costuri ascunse. Autorul a ales să **reconstruiască doar piesele relevante din Hermes** în propriul setup Claude Code, în loc să instaleze ceva off-the-shelf. Concluzia: mai lent la start, dar infinit mai scalabil și mai ușor de înțeles și reparat.

Extrem de relevant pentru Echo Core — confirmă că abordarea ta (custom, modular, controlat) e corectă strategic.

---

## Puncte cheie

**1. Cele 3 costuri ascunse ale sistemelor off-the-shelf (OpenClaw/Hermes)**
- **Moștenești asumpții pe care nu le-ai ales** — self-learning loop-ul Hermes nu are validare externă; modelul se autoevaluează (grade your own homework), poate suprascrie silențios skill-uri bune cu versiuni mai slabe
- **Nu poți repara ce nu înțelegi** — OpenClaw: 200+ vulnerabilități identificate, 386 pachete malițioase descoperite de un cercetător de securitate
- **Nu scalează pe business** — Hermes e proiectat pentru un singur client/brand; pentru agenții/multi-client trebuie instalări separate, fiecare cu propria memorie

**2. Identity layer**
- Hermes: `memory.md` + `user.md` injectate la fiecare conversație — simplu și eficace
- Limitare: nu poți comuta între clienți/branduri fără instalări separate
- Soluție custom: folder per client cu `brand voice`, `ICP`, `visual identity` + skills **shared** între toți clienții dintr-o singură instalare

**3. Memory system**
- Hermes: autosave + summarize la fiecare turn, injectare în conversație (cap ~1300 tokens), recall prin **keyword search** — slab pentru memorie pe termen lung
- Soluție custom: același pattern de injectare (recent memory MD), dar recall prin **semantic search** (embeddings / mem search) — găsești informații după sens, nu după cuvinte exacte

**4. Self-learning loop — controversat**
- Hermes creează automat un skill nou după fiecare task — rapid la start
- Problemă la scală: după 10-20 skill-uri, ajungi cu 15 versiuni ale aceluiași lucru (LinkedIn post V1, V2, V3...), greu de menținut
- **Soluție custom: skill systems modulare** — fiecare skill face un singur lucru, stă într-un singur loc, se actualizează într-un singur loc; un skill system le înlănțuiește în ordinea corectă
- Când vocea brandului se schimbă: un singur fișier de actualizat, toate sistemele trag din el

**5. Concluzie strategică**
- Hermes: mai rapid la start
- Custom: mai rapid la a 10-a, 100-a iterație — fiecare strat e vizibil, editabil, reutilizabil
- Alegerea depinde de context; nu există răspuns universal

---

## Citate relevante

> "You can't fix what you don't understand underneath."

> "The same model that writes the skill is also the sole judge of its correctness."

> "When your brand voice shifts, you've got like 15 places to go and update."

> "Hermes is faster to start, but your own setup is actually going to be faster to scale."

---

## Idei acționabile pentru Echo Core

- [ ] **Skill systems modulare** — Echo are deja o structură similară (personality/*.md, tools separate). Verifică dacă skill-urile noi (pauze respirație, coaching etc.) urmează pattern-ul modular sau acumulează duplicat
- [ ] **Semantic recall confirmat corect** — Echo folosește deja Ollama all-minilm embeddings pentru memory search semantic. Asta e exact ce autorul recomandă față de Hermes keyword search. Confirmăm că arhitectura e solidă.
- [ ] **Validare externă pentru self-improvement** — Ralph scrie cod autonom; reviewul vine din skills gstack (/qa, /review). Dacă vrei un self-learning loop pentru Echo, adaugă un pas de validare externă (teste, comparare cu versiunea anterioară) înainte de a accepta skill-ul nou.

---

*Salvat: 2026-05-30*