한 step에 switch X
새 prompt나 model이 다른 production code랑 같은 식으로 live: feature flag 뒤, low traffic에 canary, monitored, ramp up. Atomic switch가 regression ship하는 법.
Rollout 패턴
- Internal canary — 너의 팀과 select power user.
- Canary traffic — production의 1–5%. Dashboard 봐.
- Ramp — 10% → 25% → 50% → 100% 시간이나 일 단위로, stake에 따라.
- Hold — 100%에 instant rollback 위해 이전 version reachable 유지.
- Cleanup — ≥1주 stable되면 이전 version retire.
Ramp 동안 watch할 것
- Quality dashboard (eval flag, complaint rate).
- Call당 cost spike.
- Latency p95.
- Refusal rate.
- Pre-ship review에서 flag한 specific failure mode.