single-pass RAG 천장
한 retrieve → 한 답은 crisp 질문에 fine. 모호한 query 또는 한 검색이 다 못 가져오는 복합 질문에서 깨짐. 두 패턴이 이 천장 넘게 push.
Self-RAG: 모델이 자기 답 판단
생성 후 모델한테 답의 retrieved 청크에 대한 groundedness score 요청. score 낮으면 rewritten query 또는 expanded k 로 retry. 비용은 LLM 호출 한 번 추가; win 은 built-in 품질 게이트.
Agentic retrieval
LLM 에 'search' 도구 주고 언제 호출할지 결정하게 함. 모델이 multi-hop query plan 가능: 먼저 일반 context retrieve, 그 다음 발견한 거에 informed 된 follow-up 검색으로 좁힘. Anthropic 의 tool-use, OpenAI 의 function calling, 모던 agent framework 가 다 이렇게 retrieval expose.