세 패턴, 각각 이기는 세 context
1. Stuff (default)
모든 retrieved 청크를 하나의 prompt 에 넣고 LLM 답하게. 단순, 싸고, top-k 청크가 context window 에 편안히 들어갈 때 옳은 답. 200K-token Claude context 면 대부분 앱 cover.
2. Map-reduce
각 청크마다 intermediate answer 생성 (map). 그 다음 intermediate answer 들을 final response 로 요약 (reduce). 코퍼스가 stuff 하기 너무 클 때 또는 답이 많은 source 종합해야 할 때 사용.
3. Refine
첫 청크에서 initial answer 생성, 후속 각 청크로 iteratively update. 순서 있는 자료 (transcript, time-series) 에서 새 context 가 override 아니라 refine 해야 할 때 유용.
고르는 법
Default 가 stuff. context overflow 또는 eval 에서 모델이 position 5 이후 청크 underuse 보일 때 map-reduce 로 전환. 순서 있는 콘텐츠에 refine. 거의 어떤 앱도 셋 다 동시에 안 필요.