query 가 시스템의 절반
대부분 팀이 document 측 (더 좋은 임베딩, 더 좋은 청킹) 만 최적화 + query 측 잊음. Query 도 임베딩 모델이 인코딩하는 string — 짧고 모호한 query 는 임베딩 잘 안 됨. 두 개의 싼 고침이 retrieval 품질을 사람들 예상보다 더 바꿈.
Multi-query expansion
LLM 한테 유저 query 를 3–5 가지 다른 phrasing 으로 rewrite 요청. 각각 임베딩. 각각 검색. RRF 로 ranking fuse. 비용: extra LLM 호출 한 번. Win: 모호한 또는 짧은 query 에서 유의미하게 높은 recall.
HyDE (Hypothetical Document Embeddings)
query 임베딩 대신, LLM 한테 query 에 대한 가설적 답 작성 요청, 그 답 임베딩 + 그걸로 검색. 작동 이유: 답과 document 가 lexical + structural 패턴 공유; 질문은 그렇지 않음. query 짧고 document 길 때 특히 강함.