두 threshold-free 요약
ROC-AUC가 모든 threshold에서 모델이 negative 위에 positive를 얼마나 잘 ordering 하는지 통합. PR-AUC(average precision)가 precision/recall curve 요약. 둘 다 threshold 무시, 둘 다 label이 아니라 score에 의존.
어느 걸 언제
class 대략 balanced이고 run 사이 단일 비교 숫자 원하면 ROC-AUC. positive class가 rare하면 PR-AUC, 모델이 positive를 거의 못 잡아도 ROC-AUC는 deceptively 높게 유지될 수 있어. fraud, churn, anomaly detection엔 PR-AUC가 거의 항상 옳은 선택.
0.5 신화
ROC-AUC 0.5는 random ordering보다 안 낫다. PR-AUC의 random baseline은 positive class 유병률 — user 1%가 churn 하면 random PR-AUC는 0.5가 아니라 0.01. PR-AUC는 항상 prevalence와 함께 보고.