Cache는 sameness 보상
Prompt caching은 안정적 콘텐츠가 시작에, 변동 콘텐츠가 뒤에 있을 때 best. Instructions, tool schema, reusable example, 안정적 corpus material이 prefix에 속해. 현재 사용자 질문, fresh diff, timestamp, run-specific ID는 tail에.
두 효과, 한 rule
Cost trick뿐 아니야. 좋은 context hygiene 강화 — 안정적 rule은 안정적, live input은 명백히 live. Cache-friendly shape와 attention-friendly shape가 같은 모양인 건 우연 X, 좋은 API 설계.
다음 백 turn 위해 구조화
Cache-friendly prompt는 reason 쉽고, diff 쉽고, behavior 바뀔 때 debug 쉬워. 다음 single turn 위해 설계는 초보, 다음 백 turn 위해 설계가 sustained-cost 승리.