AI CI 청구는 달라
표준 CI 비용은 runner 분. AI CI 는 추가로 태움:
- API token — 모든 eval 호출이 Anthropic / OpenAI 등에 닿음.
- GPU 분 — CPU 보다 자릿수 차이.
- Cloud egress — 모델 / dataset 들고/낼 때.
- Model registry 저장 — checkpoint 가 쌓임.
Discipline 체크리스트
- (prompt SHA, 모델 버전, scorer SHA) 로 eval 결과 cache. 그거 안 바뀐 PR 에 모델 재호출 안 함.
- Smoke vs full — PR 엔 작은 subset, main / nightly 엔 full.
- Docs-only 엔 skip — AI workflow 에
paths-ignore. - Concurrency — PR 재 push 에 cancel-in-progress.
- 예산 알림 — API provider 에 월 지출 cap; 예산 차단기 발화하면 CI fail-fast.
- 중노동은 self-hosted — 홈랩 GPU 분당 무료.
가시성
Run 의 API token 사용을 GitHub Step Summary 에 추가. 분기 동안 어떤 prompt / 어떤 test 패턴이 청구 지배하는지 볼 수 있음.