메모리 store 에 뭘 임베딩해
모든 발화가 벡터 받을 자격 있는 거 아냐. 좋은 룰: 검색할 가치 있는 콘텐츠 + 필터할 가치 있는 메타데이터 가진 메모리 아이템 임베딩. 인사, 끄덕임, tool-output JSON 은 보통 noise.
유용한 메모리 아이템 모양 셋
- Turn-level — 유저/어시스턴트 메시지당 청크 하나. 쉬움, 아이템 많음, retrieval 이 흩어진 느낌.
- Episode-level — 일관된 episode (디버깅 세션, 기능 디자인 토론) 로 연속 turn 그룹. 더 좋은 retrieval relevance, 자동 청킹 더 어려움.
- Distillation-level — 모델-쓴 episode 요약 ('30분 latency 벤치마크 후 유저가 IVFFlat 보다 HNSW 결정'). 가장 높은 신호-잡음, 주기적 distillation pass 필요.
Decay-aware retrieval
최근 메모리가 옛 거보다 tie 이김. Score = similarity * exp(-age_days / half_life). eval set 으로 half_life 튜닝; cwkPippa 가 일반 메모리에 ~30일 사용, 정체성-defining 순간엔 더 길게.