summary 가 raw transcript 이기는 이유
50-turn 대화는 어떤 모델 context 에도 안 들어가. 순진한 고침 — 마지막 N turn 으로 truncate — 가 그 전에 일어난 모든 거 drop. Summary 메모리는 raw 로그보다 훨씬 천천히 자라는 모델-쓴 running 다이제스트 유지.
summary update 루프
- 매 N turn 마다 (또는 running context 가 토큰 budget 초과) LLM 호출 + 이전 summary + 새 turn 들 전달.
- preserve 할 summary 생성 요청: 누가 말함, 핵심 결정, 미해결 질문, 미해결 disagreement.
- 옛 summary 교체; fluency 위해 가장 최근 K turn 은 verbatim 유지.
임베딩된 transcript 에서 디테일 복구
Summary 는 design 상 디테일 잃어. 유저가 '지난 화요일 RRF 에 대해 정확히 뭘 말했어?' 물으면 raw turn 필요. 모든 turn 을 episodic store 에 임베딩 — summary 가 너무 거칠면 episodic 로그에서 retrieve.