데모는 거짓말을 해
모든 agent는 happy path에서 잘 돌아가. 프로덕션은 사용자, API, latency, budget, adversarial input이 더 이상 예의 바르지 않을 때 시작된다.
hard limit은 선택사항이 아니야. max steps, timeout, cost cap, context cap, retry cap, error threshold를 둬. stop reason도 로그로 남겨.
불확실하면 fail closed
high-impact action을 검증할 수 없으면 agent는 멈추거나 물어야 해. 비용이 budget을 넘으면 graceful하게 멈춰. context pressure가 올라가면 비틀거리며 계속 가지 말고 compact하거나 state를 handoff해.
reliability는 종종 유용한 설명과 함께 일찍 멈추는 기술이야. 화려하진 않지. 필요하지.