퀴즈 · 5 questions
🔍 모델 발표 읽기
다섯 질문, 한 어휘집, hype 없음
Level 0Scout
0 XP0/41 lessons0/12 achievements
0/100 XP to next level100 XP to go0% complete
Quiz
01모델이 '235B-A22B 파라미터' 로 발표. 이 표기 의미?
Hint
X total, A 가 토큰당 active 의미.
02발표가 'state-of-the-art on MMLU' headline. 왜 cautious?
Hint
모두가 87–92% score 면 차이가 noise.
03모델이 같은 checkpoint 에서 'fast' 와 'thinking' mode 둘 다 작동 (Qwen3-style). Reasoning capability 에 대해 무엇 증명?
Hint
같은 weights 파일 ⇒ inference 만 다를 수 있음.
04대부분 open-weight LLM (Llama, Qwen, Mistral, DeepSeek) 의 가장 좋은 묘사는?
Hint
Actual license 파일 안 읽었으면 모름.
05Model card 와 system card 읽을 때 가장 정확한 진술은?
Hint
두 문서, 두 angle, 배포 전 둘 다 읽을 가치.
댓글 0
🔔 답글 알림 (로그인 필요)로그인 — 댓글을 남기려면 로그인해 주세요.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.