Stream

퀴즈 · 5 questions

🏋️ 학습 테크닉

결과를 만들거나 깨뜨리는 노브들

Level 0관찰자

0 XP0/43 lessons0/11 achievements

0/120 XP to next level120 XP to go0% complete

Quiz

01LoRA/QLoRA 파인튜닝의 추천 시작 learning rate는?

02Gradient accumulation이 뭐 해?

03파인튜닝 loss 곡선에서 overfitting의 정석 신호는?

04DPO가 전통 RLHF 대비 갖는 이점은?

05Pairwise 비교에 LLM-as-judge 쓸 때 왜 A/B 위치 randomize?

← Previous평가 방법 📚 파인튜닝 프로젝트 →프로젝트: 커스텀 Instruction Follower

이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)

로그인 — 댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.