Dropout — 가장 흔한 regularizer. rate=0.2~0.5 가 흔한 시작점. 학습 시만 켜져 (training flag 자동). 근데 너무 높으면 underfit, 너무 낮으면 overfit — validation curve 보고 튜닝.
Reshape / Flatten / Permute — shape 변환. Flatten 은 (batch, ...) 을 (batch, total) 로. Reshape 는 자유 형태. Permute 는 차원 순서 바꿈 (channels-first ↔ channels-last 마이그레이션 시).