모든 model에서 쓸 어휘
Keras에 layer가 100개 넘지만 실제로 자주 쓰는 건 작은 핵심 그룹이야. 이걸 외우면 나머지는 따라와.
핵심 layer: Dense (완전연결), Conv2D (이미지 convolution), BatchNormalization, Dropout, MaxPooling2D, GlobalAveragePooling2D, Flatten, Reshape.
Activation 함수: relu (hidden layer 기본), gelu (transformer hidden), swish (EfficientNet), tanh (LSTM/GRU cell), sigmoid (이진 출력), softmax (다중 출력 — 단 numerical stability 위해 loss에서 from_logits=True랑 짝).
from_logits=True 관용구:
SparseCategoricalCrossentropy나 BinaryCrossentropy 쓸 때는 항상 from_logits=True 설정하고, model 출력 layer에서 softmax/sigmoid 빼. loss가 안에서 numerically stable한 log-sum-exp 공식으로 activation 계산해. softmax 다음에 log 취하면 극단 logit에서 NaN 생길 수 있거든.