~24 min · trl, sft-trainer, sft-config, supervised-fine-tuning
Level 0관찰자
0 XP0/43 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete
추천 경로
TRL의 SFTTrainer가 supervised fine-tuning 추천 방법. 토큰화, 포맷팅, loss masking, chat template, 학습 루프를 깔끔한 API 하나로 처리. 너는 모델, LoRA config, 데이터셋, SFTConfig 제공 — 트레이너가 나머지 다.