C.W.K.
Stream
Lesson 02 of 10 · published

Extended thinking 모드 — Claude, OpenAI, Gemini 차이

~20 min · reasoning, extended-thinking, providers

Level 0수련생
0 XP0/100 lessons0/14 achievements
0/120 XP to next level120 XP to go0% complete

Native reasoning은 별도 API surface

Claude는 Extended Thinking; OpenAI는 o-series와 GPT-5.5 reasoning-effort knob; Gemini는 Thinking 모드. interchangeable 아니고, 한 곳에서 work하는 프롬프트가 다른 곳에서 반드시 work하지 않아.

Provider별 quirk

  • Claude (Extended Thinking) — 토큰 단위 explicit thinking budget. Thinking이 response의 별도 부분 (operator한테 보임, 항상 user한테는 X). thinking에 prompt 가능 ('constraint 먼저 요약, 그 다음…'), 근데 모델이 budget 사용 결정.
  • OpenAI o-series와 GPT-5.5 — reasoning_effort parameter (low / medium / high). reasoning 토큰 billed인데 developer한테 return X. 다른 prompt 스타일: instruction이 더 짧은 경향; over-prompting이 모델 planning 방해 가능.
  • Gemini Thinking — thinking budget을 generation config로 configure. output 행동 Claude 비슷, specific 차이 있음.

native reasoning 쓸 때

  • ordinary output이 step 놓치는 hard, multi-step task.
  • latency 감당 가능한 task (reasoning 느림).
  • cost 감당 가능한 task (reasoning 토큰 billable).

skip하는 때

  • Low-latency real-time UX (reasoning이 초 추가).
  • Trivial classification이나 formatting.
  • Tight 토큰 budget.

Code

Claude Extended Thinking·python
client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    thinking={"type": "enabled", "budget_tokens": 10_000},
    messages=[{"role": "user", "content": problem}]
)
OpenAI reasoning·python
client.responses.create(
    model="gpt-5.5",
    reasoning={"effort": "high"},
    input=[{"role": "user", "content": problem}]
)

External links

Exercise

같은 hard task를 Claude (extended thinking on/off)와 OpenAI (reasoning_effort low/high)에 돌려. cost, latency, 정확도 비교. 너의 use case에 어떤 조합이 이기는지 결정.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.