C.W.K.
Stream
Lesson 08 of 08 · published

Parameter Deep Dive — temperature, seed, reasoning_effort

~22 min · temperature, top_p, seed, params

Level 0Tokenizer
0 XP0/54 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete

API 파라미터는 한 번에 한 개씩 만져. temperaturetop_p 둘 다 무작위성을 잡아 — 동시에 만지면 결과를 reason 할 수 없어. 한쪽 고정 (top_p=1) 하고 다른 쪽 sweep.

Seed 는 best-effort, contract 아님

같은 seed + 같은 모델 snapshot + 같은 파라미터 = 거의 deterministic. 거의. 테스트의 강한 nudge 정도로 보고, 계약처럼 의존하면 다쳐.

max_completion_tokens 가 max_tokens 대체 중

Responses 와 새 Chat Completions 에선 max_tokens phase out. max_completion_tokens 써. max_tokens 박힌 옛 코드는 o-series 에서 조용히 실패.

Reasoning effort (o-series 한정)

reasoning_effort='high' 는 hidden chain-of-thought 토큰을 더 쓰라는 뜻 — 대신 cost 와 latency 폭증. 'low' 는 빠르고 싸지만 hard reasoning 에서 깨져. 작업별로 knee 찾아서 박아.

External links

Exercise

같은 프롬프트를 temperature 0, 0.7, 1.2 로 5 번씩 돌려서 첫 80 자 출력. 그 다음 셋 다에 seed=42 추가하고 5 번씩 더 — convergence 가 어떻게 바뀌는지 관찰. 본 걸 두 문장으로 정리.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.