Loss 가 gradient signal; metric 이 성적표
loss 에 train. task-specific metric 에 evaluate. 같은 숫자 아니고, 차이 중요.
Classification metric
- Accuracy — 정확하게 predict 한 비율. 해석 쉬움, class 불균형이면 무용.
- Precision / Recall / F1 — accuracy 를 'positive predict 한 거 중 실제 positive (precision)' 와 '모든 실제 positive 중 잡은 거 (recall)' 로 분해하는 per-class metric. F1 이 그것의 harmonic mean.
- Top-K accuracy — 진짜 class 가 top K prediction 안에 있는 비율. ImageNet 표준 (top-1, top-5).
- ROC AUC — receiver operating characteristic 아래 면적. binary classifier 용; threshold-independent.
Regression metric
- MAE / RMSE — mean absolute error 와 root mean squared error. 둘 다 target 단위.
- R² — 설명된 variance 비율.
validation 만, eval mode 에서, inference_mode 로 metric 계산
metric 계산이 training-mode 행동 (BatchNorm, Dropout) 오염하거나 필요 없는 autograd graph 짓길 원치 않음.
torchmetrics — 직접 짜기 싫을 때
torchmetrics 패키지 (별도 설치) 에 모든 흔한 metric 의 tested 구현, 포함 streaming variant 가 batch 들 누적 update. accuracy 넘어선 거면 의지.