agent가 어떻게 실행되는지가 제품을 바꿔
synchronous API agent, background worker, scheduled monitor, event-driven webhook agent는 failure mode가 다르다. prompt가 architecture를 해결했다고 착각하기 전에 deployment shape부터 골라.
long-running agent는 보통 queue나 job runner 뒤에 있어야 해. 사용자는 멈춘 request 대신 status, cancellation, partial result를 받는다.
graceful failure는 기능이다
agent가 실패하면 state를 보존하고, 무엇이 완료됐는지 설명하고, 무엇이 실패했는지 식별하고, next action을 제안하고, 성공한 척하지 않아야 해.
가장 좋은 failure mode는 human, 더 단순한 workflow, saved draft로 handoff하는 경우가 많다. silent failure는 배신이고, state가 있는 loud failure는 회복 가능하다.