Spine이 일을 carry한다
Long-running prompt는 구조적으로 세 zone — spine(안정), body(선택적), tail(live). spine은 turn 사이 안 변해야 할 모든 것 — system rule, tool schema, reusable example, role 정의. 위에, system prompt나 첫 user message에 살고, request 사이 byte-identical해야 caching이 hit.
Spine 안정성의 복합 이득
Cache hit rate 올라감. Attention sink behavior가 rule 선호. Request 간 diff review가 trivial. 모형 behavior가 예측 가능 — 운영 context가 예측 가능하니까. 매 turn timestamp나 live state로 system prompt 재생성하면 다 사라져.
Spine을 versioning
Spine을 코드처럼 다뤄 — version label 붙이고, change-log하고, rule 바꾸면 명시적으로 version bump. Telemetry는 request당 spine version 기록. behavior 바뀌면 모형 탓인지 input 탓인지 rule 탓인지 알아야 해.