API 파라미터는 한 번에 한 개씩 만져. temperature 와 top_p 둘 다 무작위성을 잡아 — 동시에 만지면 결과를 reason 할 수 없어. 한쪽 고정 (top_p=1) 하고 다른 쪽 sweep.
Seed 는 best-effort, contract 아님
같은 seed + 같은 모델 snapshot + 같은 파라미터 = 거의 deterministic. 거의. 테스트의 강한 nudge 정도로 보고, 계약처럼 의존하면 다쳐.
max_completion_tokens 가 max_tokens 대체 중
Responses 와 새 Chat Completions 에선 max_tokens phase out. max_completion_tokens 써. max_tokens 박힌 옛 코드는 o-series 에서 조용히 실패.
Reasoning effort (o-series 한정)
reasoning_effort='high' 는 hidden chain-of-thought 토큰을 더 쓰라는 뜻 — 대신 cost 와 latency 폭증. 'low' 는 빠르고 싸지만 hard reasoning 에서 깨져. 작업별로 knee 찾아서 박아.