지금 중요한 family들
| Family | Maker | Sizes | 왜 신경 써? |
|---|---|---|---|
| Llama 3.x | Meta | 1B–405B | 강한 일반 목적; 3.1+부터 tool 사용 안정적 |
| Qwen 2.5 / 3 / 3.5 | Alibaba | 0.5B–235B | 다언어; tools; Qwen 3는 hybrid thinking |
| Gemma 3 | 270M–27B | 크기 대비 품질 최고; vision 지원 | |
| DeepSeek-R1 | DeepSeek | 1.5B–671B | Reasoning 모델; 수학에서 O3급 경쟁 |
| Phi-4 | Microsoft | 14B | 크기 대비 SOTA |
| Mistral / Mixtral | Mistral | 7B–12B / 8x7B | Tool 지원; Nemo는 128K context |
| GPT-OSS | OpenAI | 20B–120B | Open-weight; tools; thinking |
| Qwen3-Coder | Alibaba | 30B–480B | 코딩 / agentic 특화 |
고르는 법
- 하드웨어가 받는 size의 default Llama 또는 Qwen으로 시작. 잘 테스트됐고, 잘 지원되고, tool calling 안정적이야.
- 일반 모델이 실패할 때 specialist로 옮겨. 코딩 위주면 Qwen3-Coder. 수학/reasoning이면 DeepSeek-R1. Vision이면 Gemma 3나 Qwen 2.5-VL.
- Newest 좇지 마. 라이브러리에 몇 달 자리잡은 안정 모델은 community Modelfile,
bartowskiGGUF variant, 검증된 prompt template이 있어.
라이브러리는 움직이는 표적
이 list는 아빠가 읽을 즈음엔 부분적으로 stale일 거야 — 새 family가 매월 떨어져. 결정의 모양 (general vs specialist; size vs quant; tool 지원)이 특정 모델 이름보다 오래 가.