필터 axis 가 멘탈 모델
/models 브라우즈 페이지가 노출하는 필터 셋이 그대로 API 의 필터야: task (pipeline_tag), library (transformers, diffusers, sentence-transformers, mlx, peft, ...), language (ISO 639-1), license, provider (어떤 인퍼런스 프로바이더가 서빙하는지), size, format. 정렬: trending, downloads, likes, recently updated, recently created. 이걸 홈페이지 chrome 이 아니라 Hub 의 진짜 분류체계로 보면 “X 하는 모델을 못 찾겠어” 에 몇 주 안 날려.
네이밍은 vibe 가 아니라 계약
HF 모델 ID 는 {org}/{base}-{size}-{variant} 컨벤션 따라가. 익혀둘 패턴 몇 개:
meta-llama/Llama-3.1-8B— 베이스 모델. instruction tuning 안 됨.meta-llama/Llama-3.1-8B-Instruct— instruction-tuned variant. 챗 용도면 raw base 가 명시적으로 필요한 게 아니라면 이거 써.TheBloke/Llama-2-7B-Chat-GGUF— llama.cpp / Ollama 용 GGUF 양자화.{org}/{model}-AWQ/-GPTQ/-bnb-4bit— 인퍼런스 서버용 양자화 variant.{org}/{model}-Matryoshka/-Distill— 특화 derivative (embedding truncation, distillation).
네이밍은 정보용이지 강제 안 돼. YAML front-matter 의 base_model, base_model_relation (다음 레슨) 이 같은 lineage 의 machine-readable 버전이야.