모델이 think하고; consumer가 read해
Reasoning은 모델용. Output은 user (또는 너의 pipeline 다음 stage)용. 둘 conflate하면 hedging과 chain-of-thought가 JSON field에 leak되는 verbose 답 만들어.
세 패턴
- Hidden thinking — Extended Thinking, o-series. Reasoning이 consumer 절대 도달 안 함.
- Tagged thinking — <thinking> 다음 <answer>. Operator read 가능, parser가 user 보기 전 strip.
- External thinking — 첫 call이 plan 생성, 두 번째 call이 그것 기준으로 execute. 두 프롬프트, 두 output, 하나는 audit log용 하나는 user용.
audit-log win
production에서 뭐 잘못되면 reasoning trace는 gold야. Hidden thinking 모델은 종종 user 안 보여줘도 developer한테 노출. trace log해; 다음 incident에서 자기한테 감사할 거야.