표준 레시피 5 단계: (1) backbone freeze, head 만 학습 (수렴 시까지). (2) backbone 일부 unfreeze (보통 마지막 1/3). (3) learning rate 10× 감소. (4) 추가 학습 (보통 epoch 적게). (5) 결과 비교 — 이득 있어야 가치.
data 가 적을 때 (< 1000 sample) 는 단계 1 만으로도 충분. data 가 많고 task 가 ImageNet 과 다를 때 (의료 / 위성) fine-tune 가치 ↑. 항상 measure first.