3.9 KiB
I Rebuilt Hermes in Claude Code (It's Ridiculously Good)
URL: https://youtu.be/wdc1OFWDxlU?si=0AqRf8_0stcSKrTi Durata: 12:56 Tags: @work @growth @project
TL;DR
Hermes e un sistem agentic cu 40k stele GitHub în 46 de zile — rapid de adoptat, dar vine cu costuri ascunse. Autorul a ales să reconstruiască doar piesele relevante din Hermes în propriul setup Claude Code, în loc să instaleze ceva off-the-shelf. Concluzia: mai lent la start, dar infinit mai scalabil și mai ușor de înțeles și reparat.
Extrem de relevant pentru Echo Core — confirmă că abordarea ta (custom, modular, controlat) e corectă strategic.
Puncte cheie
1. Cele 3 costuri ascunse ale sistemelor off-the-shelf (OpenClaw/Hermes)
- Moștenești asumpții pe care nu le-ai ales — self-learning loop-ul Hermes nu are validare externă; modelul se autoevaluează (grade your own homework), poate suprascrie silențios skill-uri bune cu versiuni mai slabe
- Nu poți repara ce nu înțelegi — OpenClaw: 200+ vulnerabilități identificate, 386 pachete malițioase descoperite de un cercetător de securitate
- Nu scalează pe business — Hermes e proiectat pentru un singur client/brand; pentru agenții/multi-client trebuie instalări separate, fiecare cu propria memorie
2. Identity layer
- Hermes:
memory.md+user.mdinjectate la fiecare conversație — simplu și eficace - Limitare: nu poți comuta între clienți/branduri fără instalări separate
- Soluție custom: folder per client cu
brand voice,ICP,visual identity+ skills shared între toți clienții dintr-o singură instalare
3. Memory system
- Hermes: autosave + summarize la fiecare turn, injectare în conversație (cap ~1300 tokens), recall prin keyword search — slab pentru memorie pe termen lung
- Soluție custom: același pattern de injectare (recent memory MD), dar recall prin semantic search (embeddings / mem search) — găsești informații după sens, nu după cuvinte exacte
4. Self-learning loop — controversat
- Hermes creează automat un skill nou după fiecare task — rapid la start
- Problemă la scală: după 10-20 skill-uri, ajungi cu 15 versiuni ale aceluiași lucru (LinkedIn post V1, V2, V3...), greu de menținut
- Soluție custom: skill systems modulare — fiecare skill face un singur lucru, stă într-un singur loc, se actualizează într-un singur loc; un skill system le înlănțuiește în ordinea corectă
- Când vocea brandului se schimbă: un singur fișier de actualizat, toate sistemele trag din el
5. Concluzie strategică
- Hermes: mai rapid la start
- Custom: mai rapid la a 10-a, 100-a iterație — fiecare strat e vizibil, editabil, reutilizabil
- Alegerea depinde de context; nu există răspuns universal
Citate relevante
"You can't fix what you don't understand underneath."
"The same model that writes the skill is also the sole judge of its correctness."
"When your brand voice shifts, you've got like 15 places to go and update."
"Hermes is faster to start, but your own setup is actually going to be faster to scale."
Idei acționabile pentru Echo Core
- Skill systems modulare — Echo are deja o structură similară (personality/*.md, tools separate). Verifică dacă skill-urile noi (pauze respirație, coaching etc.) urmează pattern-ul modular sau acumulează duplicat
- Semantic recall confirmat corect — Echo folosește deja Ollama all-minilm embeddings pentru memory search semantic. Asta e exact ce autorul recomandă față de Hermes keyword search. Confirmăm că arhitectura e solidă.
- Validare externă pentru self-improvement — Ralph scrie cod autonom; reviewul vine din skills gstack (/qa, /review). Dacă vrei un self-learning loop pentru Echo, adaugă un pas de validare externă (teste, comparare cu versiunea anterioară) înainte de a accepta skill-ul nou.
Salvat: 2026-05-30