퀴즈 · 5 questions
📐 AI를 위한 선형대수
왜 모든 모델은 dot product + GEMM으로 무너지는가 — roofline이 진실을 말해줘
Level 0Beginner
0 XP0/38 lessons0/12 achievements
0/100 XP to next level100 XP to go0% complete
Quiz
01BLAS Level 중 GPU 적합성이 가장 높은 거랑 그 이유?
Hint
load한 byte 각각이 몇 번 재사용되나 생각해.
02GPU의 'coalesced access'가 뭘 의미해?
Hint
인접 thread들의 access 패턴 얘기야.
03FLOPs/byte 낮은 (< 4) 커널은 보통:
Hint
load한 byte당 적은 FLOP = 메모리 기다림 많음.
04왜 cuBLAS default가 column-major인가?
Hint
역사적 artifact지 하드웨어 요구사항 아냐.
05왜 batched transformer inference가 single-token decoding보다 토큰 당 훨씬 빠른가?
Hint
토큰 당 FLOP 수는 같음. 바뀌는 건 intensity.
댓글 0
🔔 답글 알림 (로그인 필요)로그인 — 댓글을 남기려면 로그인해 주세요.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.