layer마다 수명이 다르다
instruction은 안정적인 의도. conversation은 최근 작업 상태. retrieval은 선택적 배경지식. tool은 바깥 세계 접근. durable memory는 window 밖에서도 살아야 하는 사실. 이걸 섞어버리면 비싸고 낡고 그래도 불완전한 giant prompt가 된다.
항상 적용될 규칙은 durable project instruction에 있어야 해. 한 답변에 필요한 사실은 retrieval이나 tool read로 충분해. 현재 계획은 handoff board에. 한 번 본 stack trace는 진단 끝나면 session 밖으로 밀어내도 돼.
맞는 수명으로 사실 옮기기
context 관리는 더 세게 요약하는 일이 아니라, 어떤 사실을 window 밖 맞는 저장소로 승격시키고 어떤 noise를 attention 밖으로 demote할지 결정하는 일이야. 매 chat마다 같은 영구 규칙을 paste하는 건 budget 낭비. 가장 최근 메시지에만 사는 handoff는 한 번의 compaction으로 사라질 위험.
결정 습관
chat에 중요한 게 등장할 때마다 수명 질문을 해: 이게 다음 session 살아야 하나, 다음 주 살아야 하나, 다음 답변까지만 살면 되나? 긴 프로젝트 동안 수십 번 이걸 묻는 게 정돈된 AI 워크플로와 prompt 묘지의 차이야.