C.W.K.
Stream
퀴즈 · 4 questions

📏 User 전에 regression catch하는 eval

Golden set, pairwise judging, prod A/B, metric design, drift

Level 0수련생
0 XP0/100 lessons0/14 achievements
0/120 XP to next level120 XP to go0% complete

Quiz

01왜 prompt 전에 eval set 작성?
02Pairwise comparison이 absolute scoring 이기는 때는?
03왜 cost와 latency를 quality랑 같이 report?
04Eval drift가 뭐야?
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.