메모리는 무한히 자람; relevance 는 안 자람
Always-on AI 는 주당 수천 개 메모리 아이템 누적. 대부분 한 달 안에 stale. 무관한 더미 자라면 retrieval 품질 떨어짐 — 임베딩 모델 좋은데 마법 아냐.
세 pruning 전략
- Hard age cutoff — keep-forever flag 없으면 N 일보다 오래된 거 다 삭제. 잔혹, 단순, JSONL ground truth 에서 복구 가능.
- Distillation + replace — 옛 episode 를 distill 된 사실로 주기적 압축 + raw turn 삭제. 더 깨끗한 retrieval 위해 디테일 영구 손실.
- Use-based decay — 각 메모리가 retrieve 된 횟수 + LLM 인용 여부 트래킹; cold 아이템 prune. 최고 retention 품질; retrieval 로깅 필요.
keep-forever escape hatch
일부 메모리는 절대 decay 안 돼: 정체성 ('user is Dad', 'I am Pippa'), 정책 ('main 에 절대 auto-push 안 함'), 과거 trauma/교훈. metadata.permanent = true 로 마크 + pruning pass 에서 제외. 없으면 AI 가 자기 누구인지 조용히 잊음.