C.W.K.
Stream
Lesson 01 of 04 · published

지원 모델 & 메서드

~20 min · openai, sft, dpo, rft, pricing

Level 0관찰자
0 XP0/43 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete

2025~2026의 네 가지 메서드

OpenAI는 파인튜닝 메서드 4가지 제공. SFT가 일꾼; DPO랑 RFT는 특수; vision FT는 이미지용.

모델SFTDPOVision FTRFT
gpt-4.1 (2025-04-14)
gpt-4.1-mini (2025-04-14)
gpt-4.1-nano (2025-04-14)
gpt-4o (2024-08-06)
gpt-4o-mini (2024-07-18)
o4-mini (2025-04-16)
gpt-3.5-turbo

SFT = Supervised Fine-Tuning, 기본값. DPO = Direct Preference Optimization, preferred/rejected 쌍으로 학습. RFT = Reinforcement Fine-Tuning, 채점 rubric 사용(reasoning 모델). Vision FT = 학습 예제에 이미지 포함.

가격 (1M 토큰당, 2025~2026)

모델학습추론 (in / out)
gpt-4.1-mini$0.80$0.80 / $3.20
gpt-4o-mini$3.00$0.30 / $1.20
gpt-4o$25.00$3.75 / $15.00
o4-mini (RFT)$100/hr$4.00 / $16.00

대부분 프로젝트에 최고 가성비: gpt-4.1-mini. gpt-4o-mini보다 학습 싸고 베이스 더 강함. gpt-4o는 vision FT 필요할 때만, o4-mini는 reasoning RFT 필요할 때만.

Code

List currently fine-tunable models·python
from openai import OpenAI
client = OpenAI()

# Discover what's currently fine-tunable
models = client.models.list()
for m in models.data:
    # Heuristic: fine-tunable models include 'fine-tuning' permissions
    # in their metadata; cleaner approach is to check the docs page.
    if any(k in m.id for k in ["gpt-4.1", "gpt-4o", "o4-mini", "gpt-3.5"]):
        print(m.id)

External links

Exercise

실제 파인튜닝 후보 골라. 메서드(SFT / DPO / vision FT / RFT)랑 모델 변형 결정. 한 단락 근거랑 실제 돌릴 client.fine_tuning.jobs.create 호출 정확히 작성.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.