퀴즈 · 5 questions
🏋️ 학습 테크닉
결과를 만들거나 깨뜨리는 노브들
Level 0관찰자
0 XP0/43 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete
Quiz
01LoRA/QLoRA 파인튜닝의 추천 시작 learning rate는?
02Gradient accumulation이 뭐 해?
03파인튜닝 loss 곡선에서 overfitting의 정석 신호는?
04DPO가 전통 RLHF 대비 갖는 이점은?
05Pairwise 비교에 LLM-as-judge 쓸 때 왜 A/B 위치 randomize?
댓글 0
🔔 답글 알림 (로그인 필요)로그인 — 댓글을 남기려면 로그인해 주세요.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.