C.W.K.
Stream
← C.W.K. Quests
🎛️

Fine-Tune Quest

최근 수정: 2026-05-04

잘 쓰던 능력 안 깨고 모델 커스터마이징하기

근거 있는 현대 파인튜닝 커리큘럼 — 언제 학습 돌리고 (그리고 안 돌리고), 검토 통과하는 데이터 준비, OpenAI managed 파인튜닝, LoRA/QLoRA와 PEFT 가족, TRL v1.0 기반 Hugging Face 스택, 학습 최적화, alignment(DPO/ORPO/SimPO), 실전 프로젝트, Ollama부터 vLLM까지의 실서비스 배포.

8 tracks · 43 lessons · ~16h · difficulty: intermediate-to-advanced

Level 0관찰자
0 XP0/43 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete
Fine-Tune Quest는 단일 원칙 위에 세워졌어 — 파인튜닝은 vibes로 돌리는 과학 실험이 아니라 측정된 실서비스 최적화야. 8 트랙이 결정(이 문제가 진짜로 커스텀 모델 필요해?)에서 시작해서 audit 통과하는 데이터 준비, OpenAI managed 파인튜닝 API, parameter-efficient 메서드(LoRA, QLoRA, DoRA, rsLoRA, AdaLoRA), Hugging Face transformers + datasets + peft + trl + accelerate 스택, 실제 결과 움직이는 학습 루프 hyperparameter, SFT 너머 alignment(DPO, ORPO, SimPO), end-to-end 프로젝트 레시피(instruction following, 도메인 전문성, 브랜드 보이스, 합성 데이터 flywheel), 그리고 실서비스에서 파인튜닝 모델 서빙(Ollama, llama.cpp, vLLM, TGI, FastAPI wrapper, 다중 adapter S-LoRA)까지 walk. 모든 트랙은 어휘가 아니라 판단을 테스트하는 퀴즈로 끝나고, 모든 레슨은 실행 가능한 예제, 주시할 실제 실패 모드, 그리고 docs 드리프트 후 다시 확인할 수 있는 권위 있는 소스랑 함께 와.

Tracks

  1. 01🎛️파인튜닝 의사결정

    0/7 lessons

    언제 학습 돌리고 언제 멈출지

    파인튜닝은 프롬프트랑 RAG가 측정 가능한 한계에 부딪혔을 때만 값어치를 해. 학습 컴퓨트에 돈 쓰기 전에 그 한계를 어떻게 찾는지 배우는 트랙이야.

    Lesson list (7)퀴즈 · 5 문제
  2. 02📊학습 데이터

    0/5 lessons

    쓰레기 들어가면 쓰레기 나와 — 파인튜닝에선 10배

    모든 파인튜닝 프로젝트에서 가장 큰 영향력을 갖는 레버. Hyperparameter는 한 자릿수 움직이고, 데이터 품질은 두 자릿수 움직여. JSONL, 포맷, 합성, 정제, split, 어노테이션 다뤄.

    Lesson list (5)퀴즈 · 5 문제
  3. 03🔑OpenAI 파인튜닝

    0/4 lessons

    매니지드, 인프라 0 경로

    데이터에서 배포된 파인튜닝 모델까지 가장 빠른 경로 — JSONL 업로드, 잡 생성, 모델 사용. SFT, DPO, vision FT, RFT — 각각이 뭘 위한 건지 + 언제 옳은 선택인지.

    Lesson list (4)퀴즈 · 4 문제
  4. 04🧩PEFT와 Adapter

    0/6 lessons

    똑똑하게 파인튜닝, 무식하게 X

    Parameter-efficient 파인튜닝 — LoRA, QLoRA, DoRA, rsLoRA — 가 파라미터의 0.1~1%만 업데이트하고 full 파인튜닝 품질의 ~95~99% 얻어. 현대 프로젝트가 파인튜닝하는 이유 대부분.

    Lesson list (6)퀴즈 · 5 문제
  5. 05🤗Hugging Face 스택

    0/5 lessons

    TRL v1.0 기반 오픈소스 경로

    풀 오픈소스 학습 스택: transformers, datasets, peft, trl, accelerate. End-to-end QLoRA 파이프라인, Hub push, Ollama용 GGUF 변환. 풀 컨트롤 필요할 때 가는 길.

    Lesson list (5)퀴즈 · 5 문제
  6. 06🏋️학습 테크닉

    0/6 lessons

    결과를 만들거나 깨뜨리는 노브들

    Learning rate, 배치 크기, loss 곡선, 메모리 최적화, alignment(DPO/ORPO/SimPO), 평가. 작동하는 학습 런을 실서비스 품질 모델로 바꾸는 hyperparameter와 기법.

    Lesson list (6)퀴즈 · 5 문제
  7. 07📚파인튜닝 프로젝트

    0/5 lessons

    데이터부터 배포까지 실전 레시피

    End-to-end 프로젝트 레시피 — instruction follower, 도메인 전문가, 브랜드 보이스, 합성 데이터 flywheel, 그리고 흔한 실패 모드 top 10 + 각각의 디버그 fix.

    Lesson list (5)퀴즈 · 5 문제
  8. 08🚀배포 & 실서비스

    0/5 lessons

    파인튜닝 모델 대규모 서빙

    Merge → 변환 → 서빙. Ollama랑 llama.cpp로 로컬. vLLM이랑 TGI로 클라우드. FastAPI wrapper, 모니터링, 다중 adapter S-LoRA, edge 배포. 학습된 adapter에서 실서비스 endpoint까지 풀 경로.

    Lesson list (5)퀴즈 · 5 문제
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.