요약이 raw history 이길 때
Long-running 챗이면 raw history가 무한정 성장하고 비용도. 주기적 요약이 옛 턴을 condensed assistant note로 교체, conversational fluff 없이 모델 필요한 fact 보존. 잘하면 quality 높게 토큰 낮게.
뭘 보존할지
좋은 요약 보존 — user-stated facts('I work in pharma'), explicit preferences('always reply in Spanish'), unresolved tasks, reached conclusions. 나쁜 요약 보존 — 인사, banter, 모델 자체 사과. 무엇 keep할지 call out하게 요약 프롬프트 hand-craft.
Drift 진짜
요약 패스마다 fidelity 잃음. 너무 많이 돌리면 모델 effective 메모리가 vague impression으로 degrade. Tier로 요약 — last-N 턴 verbatim, 중간 tier 가볍게 요약, 가장 옛 tier 무겁게 요약 — 한 flat compression 대신.
원칙: 요약은 lossy compression. Compressor 호출 전에 keep 가치 있는 거 결정.