두 실패 모드
Underfitting: 모델이 training data 위에서도 구조를 못 잡아. training loss 높고 validation loss 비슷. 용량 / feature / 표현 추가로 fix. Overfitting: 모델이 training data를 외워. training loss 작고 validation loss 훨씬 나빠. 용량 줄이거나 regularize 하거나 데이터 더 얻어서 fix.
Ridge, Lasso, Elastic Net
Ridge(L2)가 계수를 0 쪽으로 shrink하지만 정확히 0으로는 강제 안 해. Lasso(L1)가 shrink하고 작은 계수를 0으로 만들어 feature selection 수행. Elastic Net이 weighted 조합, high-dimensional tabular에 종종 가장 안전한 default. 튜닝 손잡이는 α(alpha): 클수록 더 shrink.
튜닝 방법
cross-validation으로 alpha를 자동 선택하는 RidgeCV / LassoCV / ElasticNetCV를 써. validation curve를 plot 해서 바닥에 있는지 절벽 근처인지 봐. regularization은 항상 feature scale 먼저 하는 pipeline 안에서 돌려.