C.W.K.
Stream
퀴즈 · 3 questions

Why Look Beyond Attention?

Transformer 가 잘하는 거, 어디서 벽에 부딪히는지, "alternative" 가 진짜 뭘 의미하는지

Level 0Observer
0 XP0/50 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete

Quiz

01표준 self-attention 의 sequence length n 에 대한 asymptotic compute complexity 는?
02KV-cache 가 뭐고 왜 long-context 추론 cost 를 dominate 하나?
03다음 중 표준 Transformer 의 진짜 bottleneck 이 아닌 것은?
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.