Augmentation 은 data 로 위장한 regularization
각 training image 의 (살짝 perturb 된) view 를 model 이 더 많이 볼수록, 외우기 더 어렵고 generalize 더 잘함. Augmentation 이 computer vision 에서 가장 비용 효과적인 단일 regularizer.
표준 image augmentation
RandomResizedCrop— random scale 과 aspect ratio crop, 고정 output 으로 resize. 표준 ImageNet-style crop.RandomHorizontalFlip(p=0.5)— natural image 에 universal.RandomVerticalFlip— up/down 이 의미 안 바꿀 때만 (medical, satellite, abstract pattern).ColorJitter— brightness, contrast, saturation, hue 변동.RandomRotation,RandomAffine— 작은 rotation 과 translation.RandomErasing— random rectangle zero (a.k.a. Cutout). 놀랍게 효과적.
Batch-level augmentation: MixUp 과 CutMix
두 image 잡고 blend — label 도 blend. model 이 mix 에 해당하는 soft label 예측 강요. modern image-classification training 의 표준 (2020+ ImageNet baseline 다 가짐).
- MixUp — Beta distribution 의 weight α 로 두 image 사이 pixel-wise linear interpolation.
- CutMix — image B 에서 rectangle cut, image A 에 paste; label 이 paste 면적으로 weight.
cardinal rule
Train transform 이 augmentation 적용; val/test transform 이 deterministic resize + normalize 만. validation data 를 augment 하면 움직이는 과녁 측정. 두 별도 Compose pipeline.