previous_response_id 는 server-side history 의 hand. 매 turn 메시지 배열 resending 대신 previous_response_id + 새 user input 만 보내면 server 가 chain 을 들고 있어. Stateful by default, cheaper by accident.
Chain 이 아니라 tree
같은 previous_response_id 를 가진 두 response = 같은 parent 에서 분기한 두 children. 독립적이고, parallel 하게 실행 가능, 둘 다 alive. A/B prompt 테스팅의 right primitive.
Server retention 은 ~30 일
OpenAI 는 response object 를 ~30 일 retrieval 가능. Long-term history 필요하면 자체 copy persist — JSONL append-only 가 canonical shape. Server 의존하지 마.
Branching exercise
3-turn 대화 진행 후 turn 2 다음 fork — 한 child 는 모델한테 polite 하게 요약, 다른 child 는 sarcastically. 둘 다 같은 previous_response_id 공유 + 다른 출력 검증.