C.W.K.
Stream
Lesson 01 of 06 · published

레이어 stack — Backbone, Training, Inference, Product

~10 min · framework, axes, literacy

Level 0Scout
0 XP0/41 lessons0/12 achievements
0/100 XP to next level100 XP to go0% complete

LLM 담론 혼란의 가장 큰 단일 원인

모든 LLM 이 네 레이어의 교차점 — backbone, training, inference, product — 에 존재. 마케팅 언어가 일부러 collapse. "AI-native architecture" 가 architectural 의미하는 것처럼 들리지만 거의 항상 얇은 product 레이어 의미. "Reasoning engine" 이 새 wiring 처럼 들리지만 거의 항상 RL post-training + extended-thinking inference. 머리속에서 레이어 분리하기 전까지 모든 발표가 noise 처럼 읽혀.

네 레이어, explicit 하게

LayerWhat it is여기 변화가 실제 의미
Backbone네트워크 wiring — attention, FFN, embedding, position encoding진짜 architectural 변화. 드물고 보통 명확히 disclose.
TrainingPretraining + post-training (SFT, RLHF, GRPO, DPO, distillation)2024–2026 의 대부분 'breakthrough' 가 실제로 사는 곳.
Inference모델 호출 방식 — standard, extended thinking, speculative decoding, beam search같은 weights, 다른 runtime. Switch 저렴.
ProductScaffolding — RAG, tool, agent, system prompt, guardrail, memoryApplication 코드. Backbone unchanged.

읽기 테스트

모델 claim 보면 물어: "이 변화 어떤 레이어에 살아?" 답이 "backbone" 이면 technical report 의 architecture 섹션에서 찾을 수 있어야 — 다른 attention type, 다른 FFN 구조, 다른 position encoding. 못 찾으면 claim 이 더 높은 레이어에 살아.

이 lesson 이 존재하는 이유

다음 몇 lesson 이 specific common claim — RAG, tool use, agent, long context, speculative decoding, GQA/MQA/MLA — 분해하고 각각이 어떤 레이어에 사는지 보여줘. 마케팅 카피가 우긴다고 해도 어느 것도 backbone 변화 아냐. Concrete 예시에서 패턴 보면 abstract 버전에 더 이상 fool 안 돼.

External links

Exercise

지난달 모델 발표 셋 가져와. 각각이 모델에 대해 하는 모든 claim 나열. 각 claim 에 실제로 사는 네 레이어 중 어느 하나로 태깅. 대부분 발표가 80% training/inference/product, 20% backbone — 근데 종종 언어가 반대로 들리게 만드는 거 발견할 거.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.