C.W.K.
Stream
Lesson 01 of 06 · published

왜 custom training loop 인가

~8 min · custom-train

Level 0Keras 도제
0 XP0/97 lessons0/20 achievements
0/120 XP to next level120 XP to go0% complete

fit() 은 happy path. training 이 optimizer 두 개 (GAN), gradient accumulation, dynamic loss weighting 필요한 순간 — `train_step()` override 하거나 `tf.GradientTape` / `torch.autograd` / `jax.grad` 로 manual loop 짠다. 네 backend 다 한 번씩 해본다.

fit() 의 default 가 부족해지는 시나리오 — GAN (두 optimizer), distillation (teacher 출력 함께), gradient accumulation (memory bound), curriculum learning (epoch 마다 loss 가중치 변화). 이런 거 만나면 fit() 이 못 따라와.

두 단계 escalation: (1) train_step() override — fit() 의 callback / distribution 그대로 유지. (2) full manual loop — 자유 최대지만 인프라 직접 짜야 함. 가능하면 (1) 이 균형점.

External links

Exercise

fit() 이 native 하게 안 주는 학습-시 feature 3 개 적어. 각각 train_step override 로 충분한지 또는 full manual loop 필요한지 메모.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.