퀴즈 · 5 questions

⚖️ LLM-as-Judge

AI 로 AI 평가 — 힘과 함정

Level 0Guesser

0 XP0/55 lessons0/10 achievements

0/150 XP to next level150 XP to go0% complete

01Eval 에 LLM 을 judge 로 쓰는 이유?

02Judge JSON output 에서 reasoning 을 verdict 앞에 두면 뭘 해?

03Pairwise judging 에서 position bias 의 표준 방어는?

04한 multi-criteria judge call vs N per-axis call 언제 써?

05왜 judge 를 인간 rating 대비 calibrate?

이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

로그인 — 댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.