training은 제일 쉬운 부분
첫 모델은 일주일. 그다음 1년이 팀 전체의 시간을 잡아먹어. ML 비용 대부분은 training 바깥에 있어 — labeling pipeline, feature pipeline, drift monitoring, retraining cadence, rollback 절차, on-call, alerting, 그리고 새 엔지니어가 원작자 페이징 없이 fix를 ship 할 수 있게 해주는 문서화.
lifecycle 청구서
- Data — 수집, 정제, labeling, 지속적 quality check.
- Features — pipeline 코드, freshness SLA, backfill 스토리.
- Training — 컴퓨트, 실험, hyperparameter search.
- Serving — latency, autoscaling, A/B 프레임워크, fallback path.
- Monitoring — input drift, output drift, calibration, 비즈니스 KPI.
- Governance — model card, audit, approval, deprecation plan.
정직한 plan
ML 약속하기 전에 라인 아이템마다 추정해. 팀이 monitoring을 staff 못 하면 모델은 조용히 degrade해. rollback path 없으면 첫 나쁜 날이 마지막 좋은 주가 돼.