클라이언트가 곧 추상화
huggingface_hub.InferenceClient 는 단일 Python 클래스, 다 얘기해: HF 호스트 Inference API, HF 통해 routing 되는 third-party 프로바이더 (Together AI, Fireworks, Replicate 등), 직접 띄운 text-generation-inference (TGI) 서버, OpenAI 호환 엔드포인트 무엇이든. provider= + model= 로 construct, chat_completion, text_generation, image_generation 같은 메서드 콜.
왜 중요한가
같은 클라이언트 코드가 dev 에선 managed Hub 엔드포인트, prod 에선 TGI 박스에 동작. 마이그레이션이 인자 두 개 바꾸기. hard-coded OpenAI 클라이언트와 비교: 콜 사이트 다시 짜야 할 거.