LLM 담론 혼란의 가장 큰 단일 원인
모든 LLM 이 네 레이어의 교차점 — backbone, training, inference, product — 에 존재. 마케팅 언어가 일부러 collapse. "AI-native architecture" 가 architectural 의미하는 것처럼 들리지만 거의 항상 얇은 product 레이어 의미. "Reasoning engine" 이 새 wiring 처럼 들리지만 거의 항상 RL post-training + extended-thinking inference. 머리속에서 레이어 분리하기 전까지 모든 발표가 noise 처럼 읽혀.
네 레이어, explicit 하게
| Layer | What it is | 여기 변화가 실제 의미 |
|---|---|---|
| Backbone | 네트워크 wiring — attention, FFN, embedding, position encoding | 진짜 architectural 변화. 드물고 보통 명확히 disclose. |
| Training | Pretraining + post-training (SFT, RLHF, GRPO, DPO, distillation) | 2024–2026 의 대부분 'breakthrough' 가 실제로 사는 곳. |
| Inference | 모델 호출 방식 — standard, extended thinking, speculative decoding, beam search | 같은 weights, 다른 runtime. Switch 저렴. |
| Product | Scaffolding — RAG, tool, agent, system prompt, guardrail, memory | Application 코드. Backbone unchanged. |
읽기 테스트
모델 claim 보면 물어: "이 변화 어떤 레이어에 살아?" 답이 "backbone" 이면 technical report 의 architecture 섹션에서 찾을 수 있어야 — 다른 attention type, 다른 FFN 구조, 다른 position encoding. 못 찾으면 claim 이 더 높은 레이어에 살아.
이 lesson 이 존재하는 이유
다음 몇 lesson 이 specific common claim — RAG, tool use, agent, long context, speculative decoding, GQA/MQA/MLA — 분해하고 각각이 어떤 레이어에 사는지 보여줘. 마케팅 카피가 우긴다고 해도 어느 것도 backbone 변화 아냐. Concrete 예시에서 패턴 보면 abstract 버전에 더 이상 fool 안 돼.