Claude 계열 — Constitutional AI의 실전

Anthropic의 Claude 모델은 decoder-only Transformer, 경쟁자와 구별되는 점은 대부분 post-training — 모든 Claude 모델이 순수 RLHF 대신 Constitutional AI로 정렬되고, tool use와 computer use를 강조해.

모델	컨텍스트	최대 출력	입출력 ($/1M)	주목할 점
Claude 3 Haiku	200K	4K	$0.25 / $1.25	빠르고 저렴, ChatGPT-Free 대안
Claude 3 Opus	200K	4K	$15 / $75	출시 시 최고 capability
Claude 3.5 Sonnet (2024)	200K	8K	$3 / $15	Tool use, computer use
Claude 3.5 Haiku	200K	8K	$0.80 / $4	~65 tokens/s
Claude 3.7 Sonnet	200K	128K	$3 / $15	Extended thinking, GPQA 84.8%

Claude 3.7 Sonnet의 128K 최대 출력이 가시적 chain-of-thought 추론 가능하게 해 — 모델이 최종 답 전에 최대 128K "thinking" 토큰 생산 가능. GPT-5의 thinking 모드, DeepSeek-R1과 모양 유사.

Constitutional AI

모든 Claude 모델이 Constitutional AI로 post-train: 작성된 원칙 집합이 fine-tuning 중 모델의 자기 비판 안내. 순수 RLHF 대비 사람 라벨링에 비례해 스케일하지 않으면서 정렬 스케일 + 원칙 자체가 검사 가능.

Code

Claude with extended thinking·python

import anthropic

client = anthropic.Anthropic()
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    max_tokens=128_000,                  # extended-thinking budget
    thinking={"type": "enabled", "budget_tokens": 80_000},
    messages=[{"role": "user", "content": "Solve: integral of x*sin(x) dx"}]
)
print(response.content)
# response.content includes a 'thinking' block + a 'text' block.
# The model 'shows its work' inside thinking, then writes the final answer.

Claude 계열 — Constitutional AI의 실전

Constitutional AI

Code

External links

Exercise

Progress

댓글 0