베이스 모델 로딩
주 경로 두 가지 — full precision(fp16/bf16)으로 full 파인튜닝 또는 LoRA, 4-bit 양자화로 QLoRA.
토크나이저 셋업
토크나이저는 모델만큼 중요해. 네가 반드시 해야 할 명백하지 않은 두 가지 —
- Padding 토큰 설정: 많은 베이스 토크나이저가 padding 토큰 없어. 합리적 기본값
tokenizer.pad_token = tokenizer.eos_token사용. apply_chat_template()사용: 현대 모델은 다 자체 chat template(Jinja2) 가져. 프롬프트 손으로 만들지 말고 항상apply_chat_template로 포맷 — 특수 토큰, 시스템 메시지, 모델별 포맷팅 올바르게 처리해줘.