C.W.K.
Stream
Lesson 07 of 10 · published

Deep Learning 이 Overkill 인 곳

~16 min · anti-patterns, tradeoffs

Level 0Curious
0 XP0/73 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete

4 개의 적신호

강한 feature 가 있는 작은 tabular. Row 수천 개, 잘 명명된 column 수십 개, 명확한 target — gradient boosting 이 본인 transformer 를 아침으로 먹어버려, VRAM 두고 싸우지도 않아도 되고.

단순 rule 이 이미 작동. if user.age < 18 then block 으로 비즈니스 문제가 풀리면 model 제안하지 마. Rule 은 auditable, 즉시, 무료, overfit 불가능.

Hard interpretability 요구. 일부 도메인 (credit scoring, medical triage, regulated industry) 은 사람이 결정을 변호해야 해. Monotonic constraint 있는 linear model 은 정직해. Black-box transformer 는 소송이고.

GPU 없이 millisecond latency 예산. CPU 에서 100ms p99 latency 는 transformer forward pass 자리가 없어. Quantization 과 distillation 이 도움 되긴 하는데, 잘 튜닝된 tree model 이 그 작업 하나도 안 하고 spec 맞추는 경우가 많아.

주의: 가장 비싼 deep learning project 는 ship 됐고, 거의 작동하고, 작동하던 정직한 baseline 을 대체한 거야. 이제 팀이 완전히 reasoning 못하는 system 의 incident response 책임자야.

진지한 어른의 질문

Neural network 손대기 전에 답을 적어 봐: 가능한 가장 단순한 게 뭐고, 점수가 몇이지? 단순한 게 0.78 찍고 본인 요구가 0.84 면 deep learning 의 여유는 6 점이야. 단순한 게 0.95 면 여유는 닫혔어.

원칙: Deep learning 안 쓰기로 결정하는 건 senior engineering 결정이야. Hype cycle 은 반대를 보상하는데 — 그래서 일부러 지루한 일 하는 게 career-grade trust 를 쌓아.

Code

Honest baselines beat hopeful neural nets·python
import time
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score

t0 = time.time()
lr = LogisticRegression(max_iter=2000, C=1.0).fit(X_train, y_train)
t_train = time.time() - t0

t0 = time.time()
preds = lr.predict_proba(X_val)[:, 1]
t_infer = time.time() - t0

print(f"AUROC: {roc_auc_score(y_val, preds):.3f}")
print(f"Train time: {t_train:.2f}s   Inference time: {t_infer*1000:.1f}ms")
print(f"Inference latency / row: {t_infer / len(X_val) * 1e6:.1f} microseconds")

External links

Exercise

팀에 보낼 1 페이지짜리 메모 써 — 본인이 deep learning 을 거부 할 시점과 마음이 바뀌게 할 조건을 설명하는. 저장해 둬. 다음에 누가 모델 제안할 때 다시 읽어.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.