C.W.K.
Stream
Lesson 08 of 08 · published

End-to-End: Hub → Train → Serve → Space

~28 min · ops, pipeline

Level 0스카우트
0 XP0/50 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete

풀 루프, 한 레포씩

여덟 트랙 합쳐: 전체가 Hub 에 존재하는 단일 end-to-end 파이프라인.

  1. Hub: base 모델 골라. SHA 핀. 카드 read.
  2. Datasets: 큐레이션된 데이터셋 pull, map 으로 전처리, processed 버전을 private 데이터셋 레포 push.
  3. Training: processed 데이터셋에 SFTTrainer + LoRA. Adapter 를 private 모델 레포 push.
  4. Merge + 양자화: adapter 를 base 에 merge, serving 위해 AWQ-양자화, real model card 와 merged AWQ variant 를 public 모델 레포 push.
  5. Serve: merged AWQ 모델 가리키는 TGI 또는 vLLM.
  6. Demo: 챗 UI 로 served 모델 wrap 하는 Gradio 또는 Docker Space.
  7. Iterate: 사용자 feedback 수집, preference 데이터셋 append, DPO 실행, 반복.

이렇게 하면 얻는 거

재현성 (모든 artifact 가 SHA). Auditability (모든 변경이 Git 커밋). Portability (read 권한 있는 누구든 스택 replicate). Versioning (어느 layer 든 명령 하나로 롤백). 비용 투명성 (각 step 의 토큰 / GPU-hour 비용이 Hub 또는 너 프로바이더에 표시).

Code

End-to-end skeleton (많은 디테일 생략)·python
# 1. Pin + base pull
from huggingface_hub import snapshot_download
base_path = snapshot_download("meta-llama/Llama-3.2-1B-Instruct",
                               revision="<sha>", local_dir="./base")

# 2. 데이터셋 process + push
from datasets import load_dataset
raw = load_dataset("HuggingFaceH4/no_robots", split="train")
processed = raw.map(my_preprocess, num_proc=4, remove_columns=raw.column_names)
processed.push_to_hub("yourname/no-robots-cwk", private=True)

# 3. SFT + LoRA (training 트랙 7번 레슨 참조)
# 4. Merge + 양자화
from peft import AutoPeftModelForCausalLM
m = AutoPeftModelForCausalLM.from_pretrained("./adapter")
merged = m.merge_and_unload()
merged.push_to_hub("yourname/llama-1b-cwk", private=True)

# 5. TGI / vLLM 통해 serve (serving 트랙)
# 6. Gradio Space 에 wrap (spaces 트랙)
# 7. Feedback 수집, preference 데이터셋 빌드, DPO, ...
루프의 Hub 레포·yaml
# Base (third-party): meta-llama/Llama-3.2-1B-Instruct
# Dataset (yours): yourname/no-robots-cwk
# Adapter (yours, private): yourname/llama-1b-cwk-adapter
# Merged (yours, public): yourname/llama-1b-cwk
# Quantized (yours, public): yourname/llama-1b-cwk-AWQ
# Demo Space (yours): yourname/llama-1b-cwk-demo

External links

Exercise

너가 가진 진짜 task 의 end-to-end 파이프라인 계획. 생성할 Hub 레포 6 개 sketch. 각각 한 문장: 누가 접근, 뭐 핀, 어떻게 재현. 적어도 step 셋 end-to-end 실행 (예: 데이터셋 처리 → LoRA → merged push). 나머지 step 은 sketch.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.