풀 루프, 한 레포씩
여덟 트랙 합쳐: 전체가 Hub 에 존재하는 단일 end-to-end 파이프라인.
- Hub: base 모델 골라. SHA 핀. 카드 read.
- Datasets: 큐레이션된 데이터셋 pull,
map으로 전처리, processed 버전을 private 데이터셋 레포 push. - Training: processed 데이터셋에 SFTTrainer + LoRA. Adapter 를 private 모델 레포 push.
- Merge + 양자화: adapter 를 base 에 merge, serving 위해 AWQ-양자화, real model card 와 merged AWQ variant 를 public 모델 레포 push.
- Serve: merged AWQ 모델 가리키는 TGI 또는 vLLM.
- Demo: 챗 UI 로 served 모델 wrap 하는 Gradio 또는 Docker Space.
- Iterate: 사용자 feedback 수집, preference 데이터셋 append, DPO 실행, 반복.
이렇게 하면 얻는 거
재현성 (모든 artifact 가 SHA). Auditability (모든 변경이 Git 커밋). Portability (read 권한 있는 누구든 스택 replicate). Versioning (어느 layer 든 명령 하나로 롤백). 비용 투명성 (각 step 의 토큰 / GPU-hour 비용이 Hub 또는 너 프로바이더에 표시).