Full 파인튜닝이 비현실적인 이유
7B 파라미터 모델 = 70억 개 부동소수점. Full 파인튜닝은 이 다 저장해야 해 —
- 모델 가중치(7B × fp16 2바이트 = 14 GB)
- Gradient(또 14 GB)
- 옵티마이저 상태(Adam은 파라미터당 2상태 = 28 GB)
- 플러스 activation, 배치 데이터, 프레임워크 오버헤드...
총 ~60~80 GB VRAM이 7B 모델 하나에. 70B 모델은 600+ GB — A100 여러 장.
| 모델 크기 | Full FT VRAM (fp16) | 필요 GPU |
|---|---|---|
| 1B | ~12 GB | RTX 3090 / 4090 |
| 7B | ~60 GB | A100 80 GB |
| 13B | ~120 GB | 2× A100 80 GB |
| 70B | ~600 GB | 8× A100 80 GB |
여기서 Parameter-Efficient Fine-Tuning (PEFT)이 등장. 70억 개 다 업데이트 안 하고 추가된 작은 subset — 보통 1% 미만 — 만 업데이트, 나머진 freeze.