C.W.K.
Stream
퀴즈 · 5 questions

⚖️ LLM-as-Judge

AI 로 AI 평가 — 힘과 함정

Level 0Guesser
0 XP0/55 lessons0/10 achievements
0/150 XP to next level150 XP to go0% complete

Quiz

01Eval 에 LLM 을 judge 로 쓰는 이유?
02Judge JSON output 에서 reasoning 을 verdict 앞에 두면 뭘 해?
03Pairwise judging 에서 position bias 의 표준 방어는?
04한 multi-criteria judge call vs N per-axis call 언제 써?
05왜 judge 를 인간 rating 대비 calibrate?
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.