imbalanced 데이터 — 한 class 가 90%, 다른 게 10% — 그냥 학습하면 모델이 '항상 majority' 로 90% 정확도. 대응 layer 별: (1) data — oversample minority 또는 undersample majority. (2) loss — class_weight={0: 0.5, 1: 5.0} 으로 minority 의 loss 증폭. focal loss 도 옵션.
(3) threshold — sigmoid 출력의 decision threshold 를 0.5 가 아니라 0.3 으로 낮춰 — recall ↑. 한 가지로 안 풀리는 경우 多 — 둘 이상 조합이 흔해.