C.W.K.
Stream
Lesson 08 of 11 · published

Claude 계열 — Constitutional AI의 실전

~10 min · claude, anthropic, alignment

Level 0Token
0 XP0/94 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete

Anthropic의 Claude 모델은 decoder-only Transformer, 경쟁자와 구별되는 점은 대부분 post-training — 모든 Claude 모델이 순수 RLHF 대신 Constitutional AI로 정렬되고, tool use와 computer use를 강조해.

모델컨텍스트최대 출력입출력 ($/1M)주목할 점
Claude 3 Haiku200K4K$0.25 / $1.25빠르고 저렴, ChatGPT-Free 대안
Claude 3 Opus200K4K$15 / $75출시 시 최고 capability
Claude 3.5 Sonnet (2024)200K8K$3 / $15Tool use, computer use
Claude 3.5 Haiku200K8K$0.80 / $4~65 tokens/s
Claude 3.7 Sonnet200K128K$3 / $15Extended thinking, GPQA 84.8%

Claude 3.7 Sonnet의 128K 최대 출력이 가시적 chain-of-thought 추론 가능하게 해 — 모델이 최종 답 전에 최대 128K "thinking" 토큰 생산 가능. GPT-5의 thinking 모드, DeepSeek-R1과 모양 유사.

Constitutional AI

모든 Claude 모델이 Constitutional AI로 post-train: 작성된 원칙 집합이 fine-tuning 중 모델의 자기 비판 안내. 순수 RLHF 대비 사람 라벨링에 비례해 스케일하지 않으면서 정렬 스케일 + 원칙 자체가 검사 가능.

Code

Claude with extended thinking·python
import anthropic

client = anthropic.Anthropic()
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    max_tokens=128_000,                  # extended-thinking budget
    thinking={"type": "enabled", "budget_tokens": 80_000},
    messages=[{"role": "user", "content": "Solve: integral of x*sin(x) dx"}]
)
print(response.content)
# response.content includes a 'thinking' block + a 'text' block.
# The model 'shows its work' inside thinking, then writes the final answer.

External links

Exercise

같은 다단계 추론 질문을 Claude 3.7 Sonnet에 thinking 켜고/끄고 보내. 켰을 때 'thinking' 블록 저장. chain of thought 읽어 — 모델이 잘못된 추론을 중간에 '깨닫고 고치나'? 모드 간 답 정확도 비교.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.