모델도 versioning 필요
'새 모델 학습함' 은 정보 부족. 어느 모델? 어떤 데이터? 어느 commit 이 생산? 어떻게 점수? Model registry 가 이걸 답함.
흔한 registry
- Hugging Face Hub — public default; private org 지원.
- MLflow — open-source, self-host 가능.
- Weights & Biases (W&B) — 전체 실험 추적 + registry.
- SageMaker Model Registry — AWS native.
- Vertex AI Model Registry — GCP native.
기록할 metadata
- Source SHA (모델 생산한 Git commit).
- 학습 데이터 버전 (DVC 버전, dataset SHA, S3 etag).
- Hyperparameter.
- Hold-out 세트 eval 점수.
- 학습 환경 (Docker image SHA, GPU 유형, 라이브러리 버전).
- Promotion stage (staging / production / archived).
CI 통합
성공한 학습 job 이 모델을 'staging' 으로 registry 에 업로드. 별도 workflow (수동 또는 예약) 가 eval gate 통과 후 'production' 으로 승격. 서빙 stack 이 시작 시 'production' pull.