Hub 가 곧 router
HF 의 Inference Providers 는 routing 레이어: 모델 고르고, 플랫폼이 어떤 프로바이더가 서빙하는지 보여주고, InferenceClient(provider=...) 요청이 HF edge 통해 그 프로바이더 hit. HF 한테 결제, HF 가 프로바이더한테 결제. Auth 는 너 HF 토큰.
왜 직접 안 가고 HF 통해서
- Auth 레이어 하나 — 토큰 하나, 프로바이더별 키 다섯 개 X.
- Billing 표면 하나 — invoice 하나, 다섯 개 X.
- Provider 추상화 — Provider A 다운되면 string 하나 바꾸기.
- Provider 별 free tier — 일부 계정에 HF 가 프로바이더별 무료 크레딧 pass-through.
직접 가야 할 때
HF 가 surface 안 하는 프로바이더 기능 (커스텀 JSON 모드, adapter routing, region 핀) 필요하면 가끔 프로바이더 native SDK 로 내려가. InferenceClient 의 escape hatch 가 OpenAI 호환 모드 — 다음 레슨.