큰 LLM 의 *모든 weight* 학습은 GPU 메모리 폭발 (Gemma 2B fine-tune 에 80GB+). LoRA — frozen base 옆에 작은 *low-rank adapter* (보통 rank 8 ~ 32) 만 학습. 학습 메모리 1/100, 저장 size 1/1000.
KerasHub 에서 한 줄: model.backbone.enable_lora(rank=8). 그 후 일반 fit() — 자동으로 adapter 만 update. 학습 후 adapter weight 만 save → deploy 시 base + adapter merge.