매 invoice의 라인 여섯
Claude 청구서가 'tokens × price'보다 더 많은 라인 가져. 호출당 지불 — input 토큰, output 토큰, cache write 토큰(cache_control 썼으면), cache read 토큰(hit 났으면), tool invocation 토큰(서버 도구), 이미지 토큰(dimension에서 계산). 각 rate 다름; 라인 레벨 플래닝이 surprise 방지.
Dominant 라인 찾기
챗 워크로드면 output 토큰이 자주 dominate(긴 답). RAG-stuffing 워크로드면 input 토큰 dominate. 반복 컨텍스트 + caching이면 cache read dominate(싸고) cache write 드물어. 어느 라인 dominate하는지 알면 다음 절약 달러가 어디서 나올지 알아.
청구서당 X, 기능당 추적
Anthropic Console이 org-level 청구 보여. 어느 기능이 비용 driving하는지 알려면 매 호출에 feature 라벨 태그하고 직접 aggregate. cwkPippa는 호출당 feature: 'chat' | 'heartbeat-weather' | 'council' 로깅하고 JSONL에서 per-feature 비용 계산 — 청구서가 가족 예산 미팅에 explainable.
원칙: 청구서는 모양 가져. Dominant 라인 찾고, 그거 optimize, 나머지 무시.