Files
clawd/memory/kb/youtube/2026-03-28-autoresearch-explained.md

4.8 KiB

AutoResearch Clearly Explained (and how to use it)

Sursă: https://youtu.be/uBWuKh1nZ2Y
Autor: David Andre
Data: 2026-03-28
Durată: 19:52
Tags: @work @scout #ai-research #automation #andrej-karpathy

TL;DR

AutoResearch e un proiect open-source de Andrej Karpathy care permite AI-ului să se îmbunătățească autonom prin rulare de experimente - păstrează ce funcționează, aruncă ce nu. Arhitectura: 3 fișiere (program.md = instrucțiuni umane, train.py = fișier editabil de AI, prepare.py = metric fix de evaluare). Poate rula 100+ experimente pe noapte. NU e doar pentru ML - funcționează pentru orice poate fi măsurat: marketing, trading, cod, website optimization, prompt engineering.

Puncte Cheie

Ce e AutoResearch?

  • Proiect open-source de Andrej Karpathy (co-fondator OpenAI, arhitectul Tesla Autopilot)
  • AI agent care rulează experimente automat, păstrează ce funcționează
  • Loop autonom: ipoteză → modifică cod → antrenează 5 min → evaluează → commit (bun) sau git reset (rău)
  • Poate rula ~100 experimente peste noapte cu time-budget fix

Arhitectura (3 Fișiere Esențiale)

  1. program.md - cel mai important, omul stabilește: goal, constraints, rules
  2. train.py - singurul fișier pe care agent-ul îl poate modifica (cod/config/prompt/ecuație)
  3. prepare.py - metric-ul și script-ul de evaluare, agentul NU poate atinge (ca să nu trișeze)

Condiții pentru Succes (toate 3 obligatorii)

  1. Metric clar - un număr, o direcție clară
  2. Evaluare automată - fără om în loop
  3. Un singur fișier - pe care agentul îl poate schimba

Unde Funcționează (Use Cases)

  • Trading - optimizare strategii (Sharp ratio ca metric)
  • Marketing - A/B testing automat (email, ad copy, landing pages, thumbnails)
  • Development - "make it faster" pe orice codebase
  • Fine-tuning AI models - modele locale pe telefon/laptop
  • Prompt engineering - optimizare system prompts pentru agenți
  • Website optimization - load times (demo video: 50ms → 25ms în 4 minute!)

Unde NU Funcționează

  • Brand design, UX, pricing (dacă "mai bun" e subiectiv)
  • Orice unde succesul = judgment call sau feeling
  • Loop prea lent (ex: pricing fără volum mare de trafic)

Quote-uri Notabile

"Most marketing teams run 30 experiments per year. The next generation will run 36,000, aka roughly 100 per day." - Eric Sue

"Any metric you care about that is reasonably efficient to evaluate can be auto researched." - Andrej Karpathy

"Soon enough the execution of any work or task will become basically free. What will become valuable is knowing what to measure, picking the right metric, and setting the right constraints. This is the skill that is going to make millionaires in the future."

"We might be in the early stages of the singularity." - Andrej Karpathy

"All LLM frontier labs will do this. They will run some sort of auto research. This is the final boss battle."

Idei și Oportunități

Pentru Marius/ROA

  1. Automatizare rapoarte ROA - optimizare query-uri SQL pentru performanță (metric: timp execuție)
  2. Email templates - A/B testing automat pentru răspunsuri clienți (metric: rata de răspuns/satisfacție)
  3. Chatbot Maria (Flowise) - optimizare prompts pentru răspunsuri (metric: relevanță/acuratețe)
  4. Website speed (roa2web) - optimizare load times (demo video: 50% îmbunătățire în 4 min!)
  5. Trading strategy - pentru personal (dacă e interesat de investiții)

Proces General

  • Definește metric CLAR (nu subiectiv!)
  • Identifică UN fișier de optimizat
  • Lasă AI-ul să ruleze experimente peste noapte
  • Skill viitor: "ce să măsori" > "cum să execuți"

Meta-Insight

AutoResearch = recursive self-improvement în practică. Nu e doar pentru ML - e pentru orice proces măsurabil. Karpathy a făcut open-source ce AI labs plătesc milioane să construiască.

  • 80/20 principle - automatizarea experimentelor = leverage maxim
  • Sub-agent spawning (Echo) - perfect pentru rulare AutoResearch loops
  • Content discovery - poate optimiza ce conținut să caute
  • Morning/evening coaching - poate optimiza prompts pentru motivare

Tehnologii Menționate

  • AutoResearch (GitHub repo de Andrej Karpathy)
  • Claude Code / Codex (pentru coding agents în demo)
  • Puppeteer (benchmark website speed în demo)
  • OxyLabs (web scraping API - sponsor video)
  • LangChain (Harrison Chase menționat pentru prompt engineering)

Acțiuni Posibile

  • Explora repo GitHub AutoResearch (Karpathy)
  • Identifică 1 proces din workflow-ul ROA perfect pentru AutoResearch
  • Test pilot: website speed optimization pentru roa2web
  • Consider: prompt optimization pentru Chatbot Maria

Procesat: 2026-03-28 cu Sonnet 4.5