최소 viable pipeline
End-to-end ML 프로젝트는 정해진 모양 가짐: contract → data ingestion → audit → split → preprocessing pipeline → baseline → tuned 모델 → evaluation → calibration → threshold → artifact → deployment → monitoring. 어느 step 건너뛰면 production에 알려진 failure mode 등장.
scale 되는 폴더 구조
ml_project/
├── data/{raw,interim,processed}
├── notebooks/
├── src/
│ ├── contract.py
│ ├── features.py
│ ├── train.py
│ ├── eval.py
│ └── predict.py
├── tests/
├── artifacts/
└── README.md
reproducibility hook
Dependency 핀(uv, pip-tools, 또는 poetry). 모든 random source seed. dataset hash, code commit, hyperparameter, metric을 한 experiment record에 log. 팀이 10분 안에 실험 재실행 못 하면, 프로젝트 reproducible 아냐.