분해
Generalization error가 bias squared(평균 prediction이 truth에서 얼마나 멈), variance(training set 사이 prediction이 얼마나 wobble), irreducible noise로 분해. 용량 적은 모델이 high bias. 용량 너무 많은 모델이 high variance. sweet spot은 합 최소화.
도구가 trade-off를 어떻게 바꾸나
- Regularization이 variance 낮추려고 bias 올림.
- 데이터 더는 bias 안 바꾸고 variance 낮춤.
- Bagging(random forest)이 high-variance tree를 평균 내서 variance 낮춤.
- Boosting이 error를 sequentially 보정해서 bias 낮춤. 안 잡으면 overfit.
왜 중요한가
둘 다 한 번에 제거 못 해. 어느 게 현재 모델을 지배하는지 알면 다음에 어떤 손잡이 돌릴지 알아. high train accuracy + low validation accuracy = variance 문제. 둘 다 low = bias 문제. 프레임워크가 추측 몇 주 절약.