Background mode 와 reasoning effort 는 orthogonal. Background 는 delivery 차원 (submit + poll + retrieve), reasoning 은 depth 차원 (hidden chain-of-thought 토큰 양).
background=True 는 job 용, chat 용 X
Long-running deep-research 호출 (60+ 초) 은 background 가 적합 — HTTP connection 을 그만큼 들고 있는 건 fragile. Submit 하고 polling 으로 결과 retrieve.
reasoning_effort 는 reasoning token cost 와 직결
o-series 에선 reasoning token 이 output rate 로 과금되지만 사용자에게 안 보여. 'high' 는 'low' 의 5-10 배 토큰 사용 가능. usage.reasoning_tokens 항상 로깅.
둘 결합하기
background=True + reasoning_effort='high' = 2-5 분 걸리는 long deep-research 호출에 right shape. 별도로 쓰는 것도 가능. 작업별 cost/quality knee 찾아서 박아.