Reciprocal Rank Fusion

RAG主要分为两个大的阶段:检索、生成 。

其中检索阶段的常见方法有:关键词检索(BM25)和语义检索(基于嵌入的向量搜索),还有一种结合多种不同检索方法的混合检索(Hybrid Retrieval)。

这时候就需要一种方法来综合这些结果,这就是 排序融合 (Rank Fusion) ,其中最有效且广泛应用的方法之一是倒数排名融合。

RRF是一种简单但非常有效的排序融合算法。它的核心思想是:我们不关心原始分数是多少,只关心一个文档在各个列表中的“排名位置”。