🧠

Transformer Quest

최근 수정: 2026-05-03

AI를 바꾼 아키텍처를 제대로 이해하기

Transformer 실무자 투어 — 토큰, embedding, attention, block, 학습, 모델 계열, 그리고 2026년에 그걸 서빙하는 데 드는 실제 숫자들까지.

8 tracks · 94 lessons · ~60h · difficulty: beginner-to-advanced

Level 0Token

0 XP0/94 lessons0/10 achievements

0/120 XP to next level120 XP to go0% complete

Transformer Quest는 프레임워크별 퀘스트 전의 개념 다리야. 끝나면 어떤 모던 모델 카드든 읽고, 외우는 게 아니라 아키텍처/학습 레시피/서빙 비용을 추론할 수 있게 돼. 8개 트랙, 94개 lesson, 모든 단계에 실행 가능한 Python과 실전 영수증.

Tracks

01⚡왜 트랜스포머인가
0/10 lessons
병렬 시퀀스 모델링 — 그게 깬 병목
트랜스포머가 실제로 푼 문제, attention이 recurrence를 이긴 이유, 2017 설계가 모던 AI 계보에서 어디에 자리 잡는지.
Lesson list (10)
퀴즈 · 4 문제→
02🔤토큰화
0/12 lessons
텍스트가 정수가 되는 법
BPE, WordPiece, SentencePiece, 그리고 실용적 결과 — GPT가 글자 못 세는 이유, 비영어가 쿼리당 더 비싼 이유.
Lesson list (12)
퀴즈 · 4 문제→
03📐Embedding과 위치
0/12 lessons
토큰 ID에서 순서 있는 dense 벡터로
모델이 정수를 기하로 바꾸는 법, 위치가 주입되는 법 — sinusoidal, learned, RoPE, ALiBi, YaRN 스케일 확장.
Lesson list (12)
퀴즈 · 4 문제→
04🎯Attention 메커니즘
0/13 lessons
Q, K, V — 그리고 그걸 스케일하는 엔지니어링
Scaled dot-product attention, multi-head, causal masking, KV cache, GQA, Flash Attention. 가장 깊은 트랙 — 두 번 읽어.
Lesson list (13)
퀴즈 · 5 문제→
05🧱Transformer block
0/12 lessons
Pre-LN, RMSNorm, SwiGLU, residual — unit cell
Attention + FFN + 정규화 + residual이 80번 쌓이는 building block이 되는 법. MoE와 GQA를 맥락 안에서.
Lesson list (12)
퀴즈 · 4 문제→
06🔥학습과 생성
0/12 lessons
Loss, 스케줄, 디코딩, 그리고 정렬
사전학습 objective, mixed precision, 디코딩 전략, RLHF / DPO / GRPO / Constitutional AI — 학습과 서빙 스택 전체.
Lesson list (12)
퀴즈 · 4 문제→
07🌳모델 계열
0/11 lessons
GPT, Llama, Mistral, Claude, Gemini, 그리고 대안들
각 주요 모델 계열이 아키텍처 템플릿에 어떻게 들어맞나, state-space 대안(Mamba, RWKV)이 실제로 어디서 경쟁하나.
Lesson list (11)
퀴즈 · 4 문제→
08🔧실전 이해
0/12 lessons
모델 카드 읽기, GPU 크기 잡기, 옳은 도구 고르기
메모리 산수, 양자화, 벤치마크, 2026의 scaling law, inference 최적화, 그리고 따라가는 법.
Lesson list (12)
퀴즈 · 4 문제→

이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

🔔 답글 알림 (로그인 필요)

로그인 — 댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.

Tracks

01⚡왜 트랜스포머인가

02🔤토큰화

03📐Embedding과 위치

04🎯Attention 메커니즘

05🧱Transformer block

06🔥학습과 생성

07🌳모델 계열

08🔧실전 이해