C.W.K.
Stream
Lesson 02 of 05 · published

쓰레기통이 아니라 예산

~24 min · budget, safety-margin, output

Level 0Window Watcher
0 XP0/50 lessons0/13 achievements
0/100 XP to next level100 XP to go0% complete

초보자의 본능

대부분 window가 찰 때까지 계속 밀어넣으려고 해. 이건 context를 저장통으로 보는 방식이야. 실전에서는 budget으로 봐야 한다.

모든 token은 기회비용이 있어. 오래된 tool dump는 새 요구사항과 attention을 두고 싸운다. 거대한 design doc은 실패한 test log와 싸운다. 모형의 긴 사과문도 다음 명령 output과 싸운다. 질문은 "들어가나?"가 아니라 "지금 attention 받을 자격이 있나?"야.

안전마진은 설계의 일부

window를 벽까지 몰지 마. output, 수정, tool result, 그리고 사람이 갑자기 "이 규칙이 더 중요해"라고 말할 여지를 남겨야 해. margin 사라지는 순간 작업은 brittle해진다 — reasoning이 거칠어지고, citation이 빠지고, 마지막 답변이 잘리고, 모형이 "네 다 맞아요" 모드로 들어가버리지.

로딩 전에 미리 잡아두기

성숙한 패턴은 output, reasoning, safety buffer를 먼저 예약하고 남은 자리만큼만 input에 쓰는 거야. 대부분 거꾸로 하다가 답변이 중간에 잘리면 놀라지.

철칙: context가 꽉 찰 때까지 기다렸다가 checkpoint 하지 마. 꽉 찬 context는 움직일 공간이 없다는 뜻이고, 가장 어려운 turn은 항상 그때 등장한다.

Code

안전마진 정책·yaml
context_budget:
  hard_limit: 100%
  checkpoint_at: 65%
  compact_or_handoff_at: 75%
  emergency_only: 85%
  never_plan_for: 100%
로딩 전에 예약·python
WINDOW = 200_000
RESERVE_OUTPUT = 16_000
RESERVE_REASONING = 12_000
SAFETY_MARGIN = 16_000

usable_input_budget = WINDOW - RESERVE_OUTPUT - RESERVE_REASONING - SAFETY_MARGIN
assert usable_input_budget > 0
print(f"Usable input budget: {usable_input_budget} tokens")

External links

Exercise

아빠 워크플로에 맞는 context budget 정책 정해. checkpoint, compaction, stop threshold 각각.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.