보편 4단계 패턴 만들기
GradientTape를 진짜로 체화하는 가장 좋은 방법은 Keras 없이 linear regression 만드는 거 — raw TF로 manual gradient descent. 여기서 쓰는 4단계가 model.fit이 내부에서 도는 그 패턴이야.
Linear regression: y_pred = W*x + b의 MSE 최소화하는 W, b 찾기.
모든 training loop의 4단계:
- Forward pass — tape 안에서 prediction 계산해야 TF가 op 녹화.
- Loss — 스칼라 loss 계산, 역시 tape 안에서.
- Backward pass —
tape.gradient(loss, [W, b])가 chain rule 자동 적용. - Update —
assign_sub로 각 파라미터에서learning_rate × gradient빼기.