퀴즈 · 6 questions

🧠 Reasoning-Oriented Models

같은 backbone, 다른 training 과 inference — 어려운 문제에 더 길게 생각

Level 0Scout

0 XP0/41 lessons0/12 achievements

0/100 XP to next level100 XP to go0% complete

01현대 reasoning model 의 가장 정확한 묘사는?

Hint

같은 backbone, 다른 training, inference.

02'Test-time compute scaling' (TTS) 가 무엇?

Hint

*Inference* 시 쓰는 compute, training 시 아님.

03DeepSeek-R1-Zero 가 시연한 놀라운 것은?

Hint

Pure RL, no SFT — 그래도 모델이 reason 하는 법 알아냄.

04Reasoning-model 'overthinking' 이 왜 실용적 문제?

Hint

Reasoning 은 *reason 할 게 있을 때* 도움.

05DeepSeek 이 도입한, reasoning RL 에서 별도 critic network 필요 제거하는 RL 알고리즘은?

Hint

G 가 'Group'; 트릭은 학습 baseline 이 아니라 *서로 비교*.

06같은 Claude 또는 Qwen3 checkpoint 가 configuration flag 로 'fast' 와 'thinking' mode 서빙. 이게 증명하는 것은?

Hint

Weights 파일 같으면 inference 만 다를 수 있어.

이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

로그인 — 댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.