모델 weight 를 Git 에 넣지 마
Git 의 4 GB 모델 checkpoint 는 나쁨: clone 영원, push limit 가 단일 파일 >100 MB 거부, Git 이 binary 를 비효율 저장. 대안 사용.
옵션
- Git LFS — 파일이 별도 LFS 저장소에 보관, repo 는 포인터 추적. 첫 GB 무료; 그 후 저장 tier 비용.
- Hugging Face Hub — 모델 weight 전용, public 무료, 대용량 private 유료. 대부분 ML pipeline 에 native.
- Cloud object 저장 (S3, R2, GCS) — CI 에서 자체 다운로드 step; scale 에 가장 쌈.
- DVC — object storage 위 Git 같은 CLI; 코드와 함께 data 버전 추적.
CI 시사점
- 모델 weight 적극 cache. 매 run 4 GB 파일 pull 은 낭비.
- Git SHA 가 아니라 모델 버전 기반 키로
actions/cache사용. - 모델이 HF Hub 에 있으면
~/.cache/huggingface안 로컬 cache 경로로huggingface_hub.snapshot_download사용 — 그 경로가actions/cache타겟.