모든 걸 설명하는 네 칸
True positive(TP), false positive(FP), true negative(TN), false negative(FN). 모든 classification metric이 이 네 숫자의 비율. 네 칸을 내재화하면 precision, recall, F1, accuracy를 룩업 없이 화이트보드에서 유도 가능.
외울 가치 있는 정의
- Precision = TP / (TP + FP) — positive로 예측한 것 중 맞은 비율?
- Recall = TP / (TP + FN) — 실제 positive 중 잡은 비율?
- F1 = precision과 recall의 harmonic mean.
- Accuracy = (TP + TN) / total — class balanced일 때만 유용.
metric 전에 matrix 읽기
단일 숫자 보고 전에 항상 confusion matrix와 per-class report 출력. 네 칸이 종종 "95% accuracy" 모델이 minority class를 한 번도 예측 안 한다는 걸 드러내.