Frontier 가 single-paradigm 아냐
"미래" 가 한 paradigm 이면 깔끔할 텐데 — 아냐. Dense, MoE, reasoning 다 alive, well, combining. 2025–2026 의 가장 성공한 모델이 조합, design space 가 여전히 확장. 이 lesson 이 production 의 조합 inventory.
Dense + reasoning
Standard dense backbone with thinking-mode 토글. Qwen3 dense variant, Claude Sonnet (버전 가로질러), reasoning post-training 한 Phi-4. 예측 가능 서빙 + 요청 시 careful 답. 2026 self-hosting 의 가장 흔한 조합 likely.
MoE + reasoning
현재 frontier paradigm. DeepSeek-R1 이 canonical 예시. 미래 frontier release (소문 GPT-5 successor, future Claude/Gemini revision) 가 MoE backbone 과 reasoning post-training 결합 widely 예상. 감당 가능 서빙 cost 의 최대 capability.
MoE + tool
Native tool calling 과 frontier MoE — o4-mini (architecture detail public-ish), function calling 의 Gemini 2.5/3.x. 조합 중요 — agent workflow 가 MoE 의 더 낮은 토큰당 compute 혜택, tool 이 그 workflow 가 무엇이든 accomplish 하는 방법.
Retrieval + reasoning
Reasoning 모델 위 build 한 RAG 시스템. 복잡한 multi-step research query 에 useful — retrieval 이 사실 가져오고 reasoning 이 chain. 2025–2026 의 대부분 "deep research" product 가 internally 이 조합 사용.
Multimodal + 모든 것
거의 모든 flagship 2025–2026 모델이 multimodal 도 (vision, 가끔 audio). Multimodal 이 mapping 한 네 축 위 자체 축 — 위 어느 조합 대체 안 함, modify. "tool 갖춘 multimodal MoE reasoning 모델" 이 현재 top-tier 모양.
Builder 에게 함의
워크로드 매치하는 조합 골라. 답이 "가장 latest, biggest 조합" 이라 가정 하지 마. 대부분 production 워크로드가 여전히 dense + standard + 가끔 tool. Frontier 존재; cheapest 사는 곳 거의 아냐.