Anthropic의 Claude 모델은 decoder-only Transformer, 경쟁자와 구별되는 점은 대부분 post-training — 모든 Claude 모델이 순수 RLHF 대신 Constitutional AI로 정렬되고, tool use와 computer use를 강조해.
| 모델 | 컨텍스트 | 최대 출력 | 입출력 ($/1M) | 주목할 점 |
|---|---|---|---|---|
| Claude 3 Haiku | 200K | 4K | $0.25 / $1.25 | 빠르고 저렴, ChatGPT-Free 대안 |
| Claude 3 Opus | 200K | 4K | $15 / $75 | 출시 시 최고 capability |
| Claude 3.5 Sonnet (2024) | 200K | 8K | $3 / $15 | Tool use, computer use |
| Claude 3.5 Haiku | 200K | 8K | $0.80 / $4 | ~65 tokens/s |
| Claude 3.7 Sonnet | 200K | 128K | $3 / $15 | Extended thinking, GPQA 84.8% |
Claude 3.7 Sonnet의 128K 최대 출력이 가시적 chain-of-thought 추론 가능하게 해 — 모델이 최종 답 전에 최대 128K "thinking" 토큰 생산 가능. GPT-5의 thinking 모드, DeepSeek-R1과 모양 유사.
Constitutional AI
모든 Claude 모델이 Constitutional AI로 post-train: 작성된 원칙 집합이 fine-tuning 중 모델의 자기 비판 안내. 순수 RLHF 대비 사람 라벨링에 비례해 스케일하지 않으면서 정렬 스케일 + 원칙 자체가 검사 가능.