디스크에서 이미지 폴더 → batched dataset 의 표준: keras.utils.image_dataset_from_directory(path, batch_size=32, image_size=(224,224)). 폴더 구조가 class 별 sub-folder 면 label 자동.
큰 dataset (수십만 장) 은 .cache() + .prefetch() 필수. .cache() 가 첫 epoch 후 RAM/SSD 캐시. prefetch(tf.data.AUTOTUNE) 가 GPU idle 시간 동안 다음 batch 준비. 둘이 epoch 시간 종종 절반 이하로.