score fusion 이 어려운 이유
다른 retriever 는 다른 scale 로 score. raw score 추가는 큰 numerical range 가진 ranker 가 우연히 이김. 프로덕션 시스템이 수렴하는 고침은 단순: score 아니라 rank 로 fuse.
Reciprocal Rank Fusion (RRF)
각 candidate 마다 RRF = sum(1 / (k + rank_i)) 를 모든 ranker 에 걸쳐 계산, 여기서 rank_i 는 i번째 ranker 의 rank (1 = best), k 는 smoothing 상수 (60 이 2009년 Cormack 논문의 canonical default).
결과: outlier 에 robust + retriever 별 파라미터 튜닝 0 + 임의 ranker 수에 작동 (3, 5, 10 retriever 다 같은 방식으로 결합) 되는 fusion score.