C.W.K.
Stream
Lesson 04 of 11 · published

GPT 계보 — GPT-1에서 GPT-5까지

~10 min · gpt, openai, history

Level 0Token
0 XP0/94 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete

OpenAI의 GPT 시리즈가 스케일링 패러다임을 정의. 순서대로 계보 읽는 게 모던 AI의 가장 빠른 역사.

모델연도params컨텍스트핵심 변화
GPT-12018117M512사전학습 + fine-tune 레시피
GPT-220191.5B1,024일관된 다단락 생성
GPT-32020175B2,048대규모 in-context learning
GPT-3.5 / ChatGPT2022~175B (유사)4k → 16kRLHF + chat 포맷으로 접근성 확보
GPT-42023~1.8T (MoE 추정)8k → 128k비전 입력 multimodal, 큰 품질 도약
GPT-4o2024n/a (native multimodal)128k오디오 + 이미지 native, 추론 비용 절감
GPT-4.12025년 4월비공개1M1M 컨텍스트, 코딩 집중
GPT-52025년 8월~1.7T 총400kfast / thinking / Pro 모드 가로지르는 실시간 router
GPT-OSS-120b2025117B (5.1B active)open weight MoE, H100 한 장에 들어감

GPT-5는 각 쿼리를 다른 추론 모드(fast, thinking, Pro)로 dispatch하는 실시간 router 도입. 총 컨텍스트 400K (입력 272K + 출력 128K). open weight 변종 GPT-OSS-120b는 Apache 2.0이고 H100 GPU 한 장에 들어가.

Code

Reading a model card systematically·python
# When you encounter a new model, extract these in order:
fields = [
    "release date",
    "parameter count (total / active for MoE)",
    "architecture shape (d_model, n_layers, n_heads)",
    "vocabulary size and tokenizer",
    "context window (input + output)",
    "training data: source, scale, cutoff date",
    "post-training stack (SFT? DPO? GRPO? CAI?)",
    "license (commercial use? attribution?)",
    "modalities (text only? vision? audio?)",
    "stated benchmarks and known weaknesses",
]
# This is the universal template that lets you place any new model
# into the lineage without getting lost in marketing claims.

External links

Exercise

계보 가로질러 OpenAI 발표 셋 골라(예: GPT-2, GPT-3, GPT-4), 각 단계에서 뭐가 바뀌었는지 5-bullet 타임라인 작성. 그 다음 궤적 기반으로 다음 주요 변화를 예측해.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.