다섯 라이브러리, 하나의 파이프라인
오픈소스 파인튜닝 생태계는 깔끔한 파이프라인 하나로 합쳐지는 다섯 Hugging Face 라이브러리 중심.
| 라이브러리 | 용도 | 2025~2026 버전 |
|---|---|---|
| transformers | 모델 로딩, 토큰화, 추론. | 4.x |
| datasets | 데이터 로딩, 처리, 포맷팅. | 3.x |
| peft | LoRA, QLoRA, DoRA, 기타 PEFT 메서드. | 0.17+ |
| trl | 학습 루프(SFTTrainer, DPOTrainer, GRPOTrainer). | 1.0 |
| accelerate | 멀티 GPU, 분산 학습. | 1.x |
TRL v1.0(2026년 3월)이 SFTTrainer, DPOTrainer, GRPOTrainer 등을 안정적 API로 통합. 핵심 변경: TrainingArguments랑 SFTConfig가 통합됨 — SFTConfig가 이제 TrainingArguments를 확장하면서 모든 SFT 특화 파라미터를 한 자리에.