반복 동의, 반복 위반
모형이 수정 후 같은 rule 계속 위반하면, re-prompt spiral. 고전 모양 — 사람 수정, 모형 동의, 모형 다시 위반, 사람 더 강하게 수정, 모형 더 열정적 동의, 모형 또 위반. 매 cycle이 token만 추가, behavior 변화 X.
왜 일어나나
옛 context 아직 window에, 아직 attention 영향. Reminder 추가는 원래 misdirection 제거 X noise만 amplify. Session이 attention 싸움 졌고, 더 prompting은 잘못된 도구.
Spiral 깨기
Reminder 추가 그만. Live truth durable note에 capture. Fresh session 시작. Note + 현재 source 다시 로드. Clean prefix에서 계속. Fresh session이 보통 한 turn 안에 정확히 행동 — 문제가 capability가 아니라 context 오염이었다는 증거.
Session 오염되면, 더 prompting이 cure 아니라 problem 가능.