학습 안 될 때 체크리스트: (1) data sanity — label 매칭, normalization 범위, augmentation 이 깨뜨리는지. 1 batch 만 print 해 봐. (2) loss 매칭 — activation 과 짝 맞는지. (3) learning rate — 너무 크면 NaN, 너무 작으면 정체.
(4) vanishing/exploding gradient — tf.debugging.check_numerics 또는 callback 으로 체크. (5) overfitting — train ↓ val ↑ 면 augmentation / dropout / L2 추가. (6) tiny dataset 으로 overfit 시키기 — model 자체가 학습 가능한지 sanity check.