퀴즈 · 6 questions
🧠 Reasoning-Oriented Models
같은 backbone, 다른 training 과 inference — 어려운 문제에 더 길게 생각
Level 0Scout
0 XP0/41 lessons0/12 achievements
0/100 XP to next level100 XP to go0% complete
Quiz
01현대 reasoning model 의 가장 정확한 묘사는?
Hint
같은 backbone, 다른 training, inference.
02'Test-time compute scaling' (TTS) 가 무엇?
Hint
*Inference* 시 쓰는 compute, training 시 아님.
03DeepSeek-R1-Zero 가 시연한 놀라운 것은?
Hint
Pure RL, no SFT — 그래도 모델이 reason 하는 법 알아냄.
04Reasoning-model 'overthinking' 이 왜 실용적 문제?
Hint
Reasoning 은 *reason 할 게 있을 때* 도움.
05DeepSeek 이 도입한, reasoning RL 에서 별도 critic network 필요 제거하는 RL 알고리즘은?
Hint
G 가 'Group'; 트릭은 학습 baseline 이 아니라 *서로 비교*.
06같은 Claude 또는 Qwen3 checkpoint 가 configuration flag 로 'fast' 와 'thinking' mode 서빙. 이게 증명하는 것은?
Hint
Weights 파일 같으면 inference 만 다를 수 있어.
댓글 0
🔔 답글 알림 (로그인 필요)로그인 — 댓글을 남기려면 로그인해 주세요.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.