멀티 에이전트 비용은 곱해져
manager가 specialist 셋을 부르고, 각 specialist가 tool loop를 다섯 번 돌고, reviewer가 두 번 돌면 사용자 요청 하나가 순식간에 수십 번의 model call이 된다. 가치 있을 수도 있어. 공짜는 아니야.
디버깅도 곱해져. agent별 trace, shared correlation id, handoff summary, 실패 branch만 replay하는 방법이 필요하다.
architecture 전에 budget
agent별 step limit과 전체 run limit을 정해. 전체 run 비용만 보지 말고 branch별 비용을 추적해. worker가 N step 안에 유용한 결과를 못 내면 멈추고 partial failure를 돌려줘.
parallelism은 wall-clock time을 줄이지만 총비용을 키울 수 있어. 둘 다 측정해.