0.5는 거의 옳은 threshold가 아니다
Default 0.5는 권장이 아니라 관습. 옳은 threshold는 false positive 비용, false negative 비용, 팀 operating capacity에 의존. 비즈니스에 매칭되도록 threshold 옮기고, vibe가 아니라 숫자로 선택을 방어해.
정직한 세 threshold 전략
- Cost-minimizing — expected cost가 minimum인 threshold.
- Recall at precision floor — precision ≥ P인 threshold (팀 capacity 고정일 때 자주 사용).
- Top-K capacity — 모두 score 매기고 top K 가져가, downstream이 그 K 위에서 act (밑에서 thresholded ranking).
threshold logging과 monitoring
threshold ship 후, 모델 version 옆에 log. drift가 모델 안 바뀌어도 옳은 threshold를 바꿀 수 있어. 의도된 operating point 대비 실제를 매주 monitor.