4 개의 적신호
강한 feature 가 있는 작은 tabular. Row 수천 개, 잘 명명된 column 수십 개, 명확한 target — gradient boosting 이 본인 transformer 를 아침으로 먹어버려, VRAM 두고 싸우지도 않아도 되고.
단순 rule 이 이미 작동. if user.age < 18 then block 으로 비즈니스 문제가 풀리면 model 제안하지 마. Rule 은 auditable, 즉시, 무료, overfit 불가능.
Hard interpretability 요구. 일부 도메인 (credit scoring, medical triage, regulated industry) 은 사람이 결정을 변호해야 해. Monotonic constraint 있는 linear model 은 정직해. Black-box transformer 는 소송이고.
GPU 없이 millisecond latency 예산. CPU 에서 100ms p99 latency 는 transformer forward pass 자리가 없어. Quantization 과 distillation 이 도움 되긴 하는데, 잘 튜닝된 tree model 이 그 작업 하나도 안 하고 spec 맞추는 경우가 많아.
진지한 어른의 질문
Neural network 손대기 전에 답을 적어 봐: 가능한 가장 단순한 게 뭐고, 점수가 몇이지? 단순한 게 0.78 찍고 본인 요구가 0.84 면 deep learning 의 여유는 6 점이야. 단순한 게 0.95 면 여유는 닫혔어.