원조 학습 알고리즘
점들이 흩뿌려져 있어. 그 관계를 선으로 요약하고 싶어. 선형 회귀 = 점에서 선까지 거리 제곱합 최소화하는 선 찾기. 끝. 아이디어 전체.
왜 "학습" 이라 불러? 선을 미리 모르고 — 데이터가 말하게 두니까. 선의 기울기와 절편이 데이터에서 학습된 파라미터. 모던 딥러닝 = 근본적으로 이 같은 루프의 fancy 버전: 파라메트릭 모델, 오차 함수, 오차 최소화하는 파라미터 찾기.
수학, 짧게
1-D 입력 와 타겟 , 원함. (기울기), (절편) 가 학습할 거. Loss = mean squared error:
최소화하는 찾기. 1-D 선형회귀엔 closed-form 해. 신경망엔 없음 — gradient descent 사용.
왜 중요
- 모든 신경망의 마지막 layer = extras 있는 선형회귀.
- 지도학습의 모든 손실 함수 = 거리-제곱 아이디어 일반화.
- ML 에서 할 모든 "fitting" 이 같은 모양: 파라메트릭 모델 + loss + 옵티마이저.
선형 회귀 = 모든 학습 알고리즘의 seed. 이해하면 나머지 지도학습 = "차원 더, 모델 fancy, 같은 루프."