Files API: 한 번 업로드, 여러 번 참조
Files API는 PDF, 이미지, 다른 문서 한 번 업로드하고 file_id 받아서 매 호출마다 바이트 재업로드 X, messages.create()에서 참조. 같은 문서 세트에 대한 long-lived 분석 세션에 유용.
Batch API: 50% 할인, 24시간 SLA
Batch API는 독립 요청 리스트를 비동기 실행. 거래: 24시간 완료 SLA(보통 훨씬 빠름) 대신 per-token 가격 ~50% 할인. 평가, 대량 분류, 콘텐츠 backfill, 실시간 응답 필요 없는 모든 거에 완벽.
둘 다 안 맞을 때
인터랙티브 user한테 실시간 스트리밍 필요하면 둘 다 안 도움. 답이 내일 나와도 되는 100 evals 돌리면 batch가 비용에서 이김. 같은 50MB PDF가 이번 주 100 챗 턴을 먹이면 files가 첫 호출 후 매 턴 업로드 지연 0으로 줄여.
원칙: 실시간엔 비용 있어. Async 워크플로우는 그걸 되찾는 곳.