왜 OpenAI 호환이 중요한가
야생의 클라이언트 대부분 — LangChain, LlamaIndex, 너 커스텀 shim, OpenAI SDK 자체 — OpenAI wire 포맷 사용. HF 의 Inference Providers 가 https://router.huggingface.co/v1/... 에 OpenAI 호환 엔드포인트 expose. OpenAI SDK 가 그 URL + HF 토큰 가리키게 하면, HF-routed 프로바이더의 어떤 모델이든 OpenAI 호출이라 생각하는 코드로 접근 가능.
같은 거
chat completions, embeddings, (일부) image 엔드포인트. messages, tools, response_format, streaming chunk JSON 모양. OPENAI_API_KEY 자리에 Authorization: Bearer ${HF_TOKEN}.
다른 거
모델 id 가 OpenAI 모델 이름 X, HF 레포 id. 일부 response 필드 (provider-specific 메타) 일부 carry, 일부 X. Rate limit 이 HF 거, OpenAI 거 X.