Files
clawd/memory/kb/insights/2026-04-01.md
2026-04-02 19:42:36 +00:00

7.9 KiB

Insights - 2026-04-01

Claude Mythos Pre-Launch Preparation

[ ] Audit Ralph Workflow ACUM (urgent)

Context: Claude Mythos (Capybara) se lansează în 1-2 luni și va fi cel mai puternic model AI din lume. Va schimba FUNDAMENTAL modul în care lucrăm cu AI - simplitate > complexitate, outcome > process. Marius folosește deja Ralph pentru dezvoltare automată, dar workflow-ul poate fi prea procedural.

Esența: "Is this instruction here because the model needs it or is it here because I needed the model to need it?" - jumătate din prompt-uri pot dispărea. Exemplu din video: prompt customer support de 3000 tokens → 30-50% devine obsolet cu modelul mai bun. Ralph PRD generator probabil are instrucțiuni procedurale care LIMITEAZĂ modelul în loc să-l ajute.

Acțiune concretă:

  1. tools/ralph_prd_generator.py - citește system prompt/instructions
  2. Identifică: ce e WHAT+WHY (păstrează) vs HOW (șterge)
  3. Test A/B: versiune simplificată vs versiune curentă → compară rezultate
  4. Întrebare cheie pentru fiecare secțiune: "Poate Mythos infera asta din context sau trebuie specificat?"

Impact 80/20: Simplificarea ACUM pregătește workflow-ul pentru upgrade, reducere costuri (mai puțini tokens), rezultate mai bune (modelul nu e limitat de instrucțiuni). 2h audit > beneficiu permanent.

Deadline: Înainte de lansare Mythos (mai-iunie 2026) - pregătirea contează.

Sursă: Claude Mythos video - checklist pregătire workflow AI


[ ] 🔐 Security Audit ROA cu Mythos (important)

Context: Mythos a găsit zero-day vulnerabilities în Ghost (50k stars GitHub) pe care security researchers nu le-au detectat niciodată. ROA = 25 ani cod legacy Visual FoxPro + FastAPI recent + roa2web. Niciodată security audit profesional.

Esența: Modelul va fi suficient de puternic să facă security review la nivel profesional. Opportunity: testează ROA codebase gratuit (well, $200/lună) înainte ca un client să descopere o vulnerabilitate costisitoare. SQL injection în Oracle queries? Authentication bypass în roa2web? Data leaks în API endpoints?

Acțiune concretă:

  1. Când Mythos se lansează → upgrade Claude Max plan ($200/lună)
  2. Ruleaza Mythos împotriva:
    • roa2web repository complet (gitea.romfast.ro/romfast/roa2web)
    • FastAPI endpoints (authentication, validation, data access)
    • Oracle query construction (SQL injection risks)
  3. Prioritizează findings după CRITICAL > HIGH > MEDIUM
  4. Fix CRITICAL imediat (poate implica angajatul nou cu supervizare)

Impact 80/20: O singură vulnerabilitate exploatată = zeci de mii € daune reputație + legal. $200 investiție preventivă = insurance policy. Plus learning pentru echipă despre secure coding.

ROI calculation: Dacă găsește 1 vulnerabilitate critică în 1h de audit = $200 worth it. Dacă găsește 0 = peace of mind tot worth it (confirmă că e OK).

Sursă: Claude Mythos video - exemplu Ghost zero-day


[ ] 💡 Outcome > Process Mindset Shift (important)

Context: Marius învață angajat nou (26 ani, 4 luni) - dă instrucțiuni detaliate pas-cu-pas. Curs NLP - focus pe tehnici și procese. Ralph workflow - PRD cu stories atomice. Pattern: specifică HOW, nu doar WHAT+WHY.

Esența: "The bitter lesson: all the way we have described process doesn't matter anymore and what matters is the outcome." Video exemplu: prompt research de 10 linii → o linie → rezultate MAI BUNE (prompt-ul detaliat LIMITA modelul). Analogie: Marius îi spune angajatului EXACT cum să facă o sarcină → angajatul nu învață să gândească, doar execută mecanic.

Acțiune concretă pentru dezvoltare:

  1. Ralph PRD: în loc de "US-001: Create login endpoint with JWT authentication, bcrypt hashing, 15min expiry" → "US-001: Secure user authentication. WHY: Protect customer financial data. CONSTRAINTS: Industry standard security, easy client integration."
  2. Instrucțiuni angajat: în loc de "Pasul 1, Pasul 2, Pasul 3..." → "Obiectiv: Factură validă în Oracle. Criterii: conform D406 ANAF, fără erori validare. Verificare: rulează test_factura.prg. Întreabă dacă blocaj."
  3. Coaching NLP: în loc de "Execută tehnica X așa" → "Outcome: clientul simte empatie. Tu alegi tehnica potrivită. Evaluare: feedback la final."

Impact subtil dar major:

  • Angajatul învață SĂ GÂNDEASCĂ, nu doar să execute → mai repede autonom
  • Claude Code (Ralph) generează soluții CREATIVE, nu doar conformă cu pattern-ul specificat
  • Marius își dezvoltă skill-ul important 2026: "name outcome, let go of process"

Trade-off: Risc short-term (rezultate mai puțin predictibile) vs benefit long-term (echipă mai autonomă, soluții mai bune).

Sursă: Claude Mythos video - scaling law & bitter lesson section


[ ] 📊 Max Plan ROI Calculator (nice-to-have)

Context: Claude Max plan $200/lună vs Pro $20/lună. Mythos va fi disponibil probabil doar pe Max (ca și Opus când s-a lansat). Întrebare: worth it pentru ROA business?

Esența: $200/lună e mult pentru freelancer/small business DACĂ gândești ca "subscription cost". E puțin DACĂ gândești ca "găsește economii în alte subscripții + time savings + prevent costly mistakes". Exemplu: 1h/zi economisită = 20h/lună = 1000 lei/oră (conservativ) = 20,000 lei valoare. $200 = ~900 lei. ROI: 22x.

Acțiune concretă:

  1. Track folosință Claude în aprilie: Câte ore economisești cu Ralph, rapoarte, coding assistance?
  2. Identify replacement subscriptions: Ce tool-uri plătite poate înlocui Mythos? (GitHub Copilot? Security scanner? Research assistant?)
  3. Calculate mistake prevention: Câte bug-uri/vulnerabilities a prins Claude Code vs câte ar fi ajuns în producție? Cost per bug fix?
  4. Decision matrix:
    • Dacă savings > $200/lună → upgrade instant
    • Dacă savings $100-200 → trial 1 lună și re-evaluate
    • Dacă savings < $100 → așteaptă până stabilizează pricing sau community plan

Context special ROA: Clienți contabili = low tolerance pentru erori (ANAF compliance). O eroare în calcul TVA poate costa client penalități + reputație Marius. Security audit value foarte înalt.

Sursă: Claude Mythos video - cost & access discussion


[ ] 🗂️ Simplificare memory/kb/ pentru Retrieval (nice-to-have)

Context: Echo folosește memory/kb/ cu 475 note (youtube/, coaching/, insights/, projects/). Retrieval curent: memory_search cu Ollama embeddings. Viitor cu Mythos: modelul poate căuta SINGUR în context bine organizat.

Esența: "We are moving to a new paradigm where you present a well-organized repo and tell the model to find what it needs vs you doing retrieval logic." Nu RAG e mort, dar gândirea se schimbă: mai puțină logică pe partea ta, mai multă încredere în model.

Acțiune concretă:

  1. Audit structură kb/:
    • Sunt folderele logice? (youtube/, coaching/, insights/, projects/ )
    • Naming conventions consistente? (YYYY-MM-DD_titlu.md )
    • Index.json up-to-date? (update_notes_index.py după fiecare salvare )
  2. Test retrieval pattern nou: în loc de memory_search + memory_get → "aici e memory/kb/ complet, găsește ce ai nevoie pentru [task]"
  3. Cleanup duplicates: Sunt note redundante care confundă retrieval? (ex: aceeași idee în youtube/ ȘI insights/)

Impact limitat SHORT-term (memory_search funcționează OK acum), dar pregătire LONG-term pentru când Mythos devine modelul standard și poate folosi context mai mare eficient.

Trade-off: 1-2h cleanup acum vs easier retrieval viitor. 80/20 says: fă-l doar dacă vezi probleme CONCRETE cu retrieval curent (nu preventiv).

Sursă: Claude Mythos video - retrieval & memory architecture section