End-to-End: Hub → Train → Serve → Space

풀 루프, 한 레포씩

여덟 트랙 합쳐: 전체가 Hub 에 존재하는 단일 end-to-end 파이프라인.

Hub: base 모델 골라. SHA 핀. 카드 read.
Datasets: 큐레이션된 데이터셋 pull, map 으로 전처리, processed 버전을 private 데이터셋 레포 push.
Training: processed 데이터셋에 SFTTrainer + LoRA. Adapter 를 private 모델 레포 push.
Merge + 양자화: adapter 를 base 에 merge, serving 위해 AWQ-양자화, real model card 와 merged AWQ variant 를 public 모델 레포 push.
Serve: merged AWQ 모델 가리키는 TGI 또는 vLLM.
Demo: 챗 UI 로 served 모델 wrap 하는 Gradio 또는 Docker Space.
Iterate: 사용자 feedback 수집, preference 데이터셋 append, DPO 실행, 반복.

이렇게 하면 얻는 거

재현성 (모든 artifact 가 SHA). Auditability (모든 변경이 Git 커밋). Portability (read 권한 있는 누구든 스택 replicate). Versioning (어느 layer 든 명령 하나로 롤백). 비용 투명성 (각 step 의 토큰 / GPU-hour 비용이 Hub 또는 너 프로바이더에 표시).

Code

End-to-end skeleton (많은 디테일 생략)·python

# 1. Pin + base pull
from huggingface_hub import snapshot_download
base_path = snapshot_download("meta-llama/Llama-3.2-1B-Instruct",
                               revision="<sha>", local_dir="./base")

# 2. 데이터셋 process + push
from datasets import load_dataset
raw = load_dataset("HuggingFaceH4/no_robots", split="train")
processed = raw.map(my_preprocess, num_proc=4, remove_columns=raw.column_names)
processed.push_to_hub("yourname/no-robots-cwk", private=True)

# 3. SFT + LoRA (training 트랙 7번 레슨 참조)
# 4. Merge + 양자화
from peft import AutoPeftModelForCausalLM
m = AutoPeftModelForCausalLM.from_pretrained("./adapter")
merged = m.merge_and_unload()
merged.push_to_hub("yourname/llama-1b-cwk", private=True)

# 5. TGI / vLLM 통해 serve (serving 트랙)
# 6. Gradio Space 에 wrap (spaces 트랙)
# 7. Feedback 수집, preference 데이터셋 빌드, DPO, ...

루프의 Hub 레포·yaml

# Base (third-party): meta-llama/Llama-3.2-1B-Instruct
# Dataset (yours): yourname/no-robots-cwk
# Adapter (yours, private): yourname/llama-1b-cwk-adapter
# Merged (yours, public): yourname/llama-1b-cwk
# Quantized (yours, public): yourname/llama-1b-cwk-AWQ
# Demo Space (yours): yourname/llama-1b-cwk-demo

End-to-End: Hub → Train → Serve → Space

풀 루프, 한 레포씩

이렇게 하면 얻는 거

Code

External links

Exercise

Progress

댓글 0