01🏠Hub 활용
0/6 lessons레포, 카드, 토큰, 캐시
Hub 가 Git-backed 레지스트리. 모든 모델/데이터셋/Space 가 계약 가진 레포. 그렇게 다루면 생태계 나머지가 compose.
오픈 모델 생태계, 처음부터 끝까지
Hub 레포 / 모델 카드 / Transformers / Datasets / InferenceClient / TGI / vLLM / Trainer + PEFT / Spaces — 그리고 Accelerate, Optimum, TRL, GGUF, ONNX, MLX 까지. C.W.K. 퀘스트 라인의 다른 퀘스트들이 의지하는 오픈웨이트 스택을 한 번에 다지는 자리야.
8 tracks · 50 lessons · ~36h · difficulty: beginner-to-advanced
pipeline() 장난감 예제 너머로 끌고 가고, 스트리밍 스케일에서 데이터셋을 다루고, InferenceClient 로 프로바이더 라우팅을 걸고, TGI 랑 vLLM 을 띄우고, PEFT (LoRA/QLoRA) 로 파인튜닝하고, Spaces 에 배포하고, 마지막으로 생태계 나머지 (Accelerate, Optimum, TRL, GGUF, ONNX, MLX) 까지 — 매 레슨이 실행 가능한 코드 조각 하나, 진짜 실패 모드 하나, 공식 문서 링크 하나로 닻을 내려. Pippa-quest 랑 oo-quest 가 canonical depth floor — 이 퀘스트도 거기 맞췄어.레포, 카드, 토큰, 캐시
Hub 가 Git-backed 레지스트리. 모든 모델/데이터셋/Space 가 계약 가진 레포. 그렇게 다루면 생태계 나머지가 compose.
pipeline() 에서 generate() 로
Transformers 가 Auto* 레지스트리 하나, 백엔드 셋 (PyTorch 디폴트), generation state machine. pipeline() 너머의 컨트롤 가능 레이어로.
Load, transform, stream, push
Datasets 가 Arrow 베이스, Hub 레포 + 로컬 파일 + streaming 소스 핸들 하는 단일 load_dataset(). Map, filter, split, Hub push — 전체 루프.
클라이언트 하나, 백엔드 여럿
InferenceClient 가 HF-호스트, third-party 프로바이더, 너 TGI 박스, OpenAI-호환 엔드포인트와 얘기하는 추상화. 같은 코드, string 하나 바꾸면 다른 백엔드.
진짜 서빙, 진짜 동시성
Continuous batching, PagedAttention, serve-타임 양자화, health 엔드포인트, 재시작 전략. pipeline()-behind-Flask 에서 실제 트래픽 처리하는 서버로.
SFT, LoRA, QLoRA, DPO
Trainer + TrainingArguments + 올바른 collator + 올바른 metric 이 canonical 루프. PEFT (LoRA / QLoRA) 가 작은 GPU 에 큰 모델 fine-tune 하는 방법. SFTTrainer 가 챗 데이터용 wrap.
Gradio, Streamlit, Docker
Space 가 manifest 로 앱 돌리는 Git 레포. ML 데모엔 Gradio, stateful 대시보드엔 Streamlit, 나머지엔 Docker, plain HTML 엔 static.
Safetensors, GGUF, MLX, DPO, E2E
Safetensors 보안, 양자화 포맷 (AWQ/GPTQ/GGUF/MLX/ONNX), Accelerate + FSDP, Optimum 의 하드웨어 런타임, preference alignment 의 TRL, end-to-end Hub→Train→Serve→Space 루프.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.