Cache state는 운영 state
Provider가 cache hit metric 노출하면 first-class telemetry로 다뤄. Cache-friendly라 생각한 워크플로가 silently 매 turn prefix 재구축할 수도 — cost graph가 알려주지만 log해야만. Cache hit ratio는 cost와 behavioral consistency 둘 다의 leading indicator.
의도적으로 cache probe
같은 prefix를 짧게 두 번 보내; 두 번째가 cache hit 보고하나 check. Prefix 1 byte 바꿔 보내; cache miss하나 check. 5분 test가 caching 전략이 의도대로 작동하는지 드러내.
Hidden state는 cache와 replay에 산다
'Mysterious'한 모형 behavior가 cache state 추적 — 이전 실험 prefix가 아직 warm해서 답 bias. Cold-restart session, force-bust cache(prefix 1 byte 변경), behavior 지속하나 봐. No면 버그가 hidden cache state, 모형 X.