비용 순서의 3 adaptation strategy
- Prompting — natural language 로 task describe. Zero training cost, fast iteration, 많은 task 에 surprisingly 잘 작동. Prompt context length 와 prompt-engineering ceiling 으로 제한.
- Feature extraction — pretrained encoder 로 data embed, embedding 위 small classical head (linear, MLP, gradient boosting) train. Backbone training 없음. Cheap, scalable.
- Fine-tuning — backbone 실제 update (full 또는 LoRA) 본인 task 에. Highest ceiling, biggest engineering investment, most overfitting risk.
팁: 이 순서로 시도하고 accuracy bar 만족하는 첫 번째에서 stop. 대부분 production 팀이 prompting + few example 이 long tail 처리한다는 거 발견, fine-tuning 은 진짜 필요한 case 에 reserve.
각각이 이길 때
- Prompting 이김 — task 가 model training distribution 안 (general reasoning, common writing task, popular language code completion).
- Feature extraction 이김 — scale 에 fast inference 필요, 관련 신호가 이미 pretrained embedding 에 capture.
- Fine-tuning 이김 — model 이 specific style, domain, format 에 consistently 행동 필요 + 수백~수천 labeled example 있음.
3 가지 다 자주 이기는 hybrid
RAG (prompting + retrieved context) + few-shot example + 위 small reranker 가 knowledge-intensive task 에 fine-tuning 자주 이김. Infrastructure 더 complex 한데 task 당 adaptation 비용 낮게 유지.
원칙: Adaptation 비용이 accuracy 만큼 중요. CPU 에 deploy 가능한 frozen-backbone classifier 가 request 당 GPU 필요한 fully fine-tuned 7B model 자주 이김. Model 만 아니라 whole pipeline engineer.