퀴즈 · 4 questions
📏 User 전에 regression catch하는 eval
Golden set, pairwise judging, prod A/B, metric design, drift
Level 0수련생
0 XP0/100 lessons0/14 achievements
0/120 XP to next level120 XP to go0% complete
Quiz
01왜 prompt 전에 eval set 작성?
02Pairwise comparison이 absolute scoring 이기는 때는?
03왜 cost와 latency를 quality랑 같이 report?
04Eval drift가 뭐야?
댓글 0
🔔 답글 알림 (로그인 필요)로그인 — 댓글을 남기려면 로그인해 주세요.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.