레이어 stack — Backbone, Training, Inference, Product

LLM 담론 혼란의 가장 큰 단일 원인

모든 LLM 이 네 레이어의 교차점 — backbone, training, inference, product — 에 존재. 마케팅 언어가 일부러 collapse. "AI-native architecture" 가 architectural 의미하는 것처럼 들리지만 거의 항상 얇은 product 레이어 의미. "Reasoning engine" 이 새 wiring 처럼 들리지만 거의 항상 RL post-training + extended-thinking inference. 머리속에서 레이어 분리하기 전까지 모든 발표가 noise 처럼 읽혀.

네 레이어, explicit 하게

Layer	What it is	여기 변화가 실제 의미
Backbone	네트워크 wiring — attention, FFN, embedding, position encoding	진짜 architectural 변화. 드물고 보통 명확히 disclose.
Training	Pretraining + post-training (SFT, RLHF, GRPO, DPO, distillation)	2024–2026 의 대부분 'breakthrough' 가 실제로 사는 곳.
Inference	모델 호출 방식 — standard, extended thinking, speculative decoding, beam search	같은 weights, 다른 runtime. Switch 저렴.
Product	Scaffolding — RAG, tool, agent, system prompt, guardrail, memory	Application 코드. Backbone unchanged.

읽기 테스트

모델 claim 보면 물어: "이 변화 어떤 레이어에 살아?" 답이 "backbone" 이면 technical report 의 architecture 섹션에서 찾을 수 있어야 — 다른 attention type, 다른 FFN 구조, 다른 position encoding. 못 찾으면 claim 이 더 높은 레이어에 살아.

이 lesson 이 존재하는 이유

다음 몇 lesson 이 specific common claim — RAG, tool use, agent, long context, speculative decoding, GQA/MQA/MLA — 분해하고 각각이 어떤 레이어에 사는지 보여줘. 마케팅 카피가 우긴다고 해도 어느 것도 backbone 변화 아냐. Concrete 예시에서 패턴 보면 abstract 버전에 더 이상 fool 안 돼.

Exercise

지난달 모델 발표 셋 가져와. 각각이 모델에 대해 하는 모든 claim 나열. 각 claim 에 실제로 사는 네 레이어 중 어느 하나로 태깅. 대부분 발표가 80% training/inference/product, 20% backbone — 근데 종종 언어가 반대로 들리게 만드는 거 발견할 거.