From 699ea3fc4f7843aa7b2128271c54b2cb1d298fc6 Mon Sep 17 00:00:00 2001 From: Echo Date: Sun, 8 Feb 2026 05:57:02 +0000 Subject: [PATCH] Update emory, memory (~2) --- memory/approved-tasks.md | 3 ++- memory/kb/projects/FLUX-JOBURI.md | 21 +++++++++++++++++++++ 2 files changed, 23 insertions(+), 1 deletion(-) diff --git a/memory/approved-tasks.md b/memory/approved-tasks.md index b89f75f..332cb68 100644 --- a/memory/approved-tasks.md +++ b/memory/approved-tasks.md @@ -55,7 +55,8 @@ **Destinație:** `memory/kb/projects/monica-ion/articole/friday-spark-XXX.md` **Format:** TL;DR + Puncte cheie + Quote-uri + Tag-uri **Model extractie:** Haiku (routine - salvare structurată) -**Model insights:** Sonnet (analiză profundă - rulează automat la 08:00, 19:00) +**Model insights:** Sonnet (analiză profundă - rulează automat la 08:00, 19:00) +**⚠️ IMPORTANT:** Sleep 3-5 secunde între fiecare articol (evită rate limiting) --- diff --git a/memory/kb/projects/FLUX-JOBURI.md b/memory/kb/projects/FLUX-JOBURI.md index c4a2812..a2bed94 100644 --- a/memory/kb/projects/FLUX-JOBURI.md +++ b/memory/kb/projects/FLUX-JOBURI.md @@ -51,6 +51,27 @@ RAPOARTE (propun) | COACHING (inspiră) | FIȘE (când aprobă) 2. Rulez: `python3 tools/youtube_subs.py URL` 3. Salvez: `kb/youtube/YYYY-MM-DD_titlu.md` cu TL;DR, puncte cheie, tags +## Web Scraping - Reguli Anti-Rate-Limit + +**⚠️ OBLIGATORIU pentru toate joburile de scraping:** +- **Delay 3-5 secunde** între fiecare request (articole, pagini web) +- **Delay 20 secunde** între video-uri YouTube (conform YOUTUBE-SETUP.md) +- **Max 40 articole** per sesiune nocturnă (evită timeout) +- **User-Agent:** Folosește user-agent real pentru web_fetch +- **Respectă robots.txt** când e disponibil + +**Aplicabil pentru:** +- Articole blog (Monica Ion, etc.) +- Video-uri YouTube +- Orice web_fetch în loop + +**Raționament:** +- Prevent IP blocking +- Respect server resources +- Professional scraping etiquette + +--- + ## Insights & Coaching **insights-extract (08:00, 19:00):**