RAG 파이프라인에 리랭커를 추가했더니 모든 것이 망가졌다

Translated for your language. Read the original.

AI-assisted draft.

RAG 파이프라인에 리랭커(Reranker)를 추가했더니 — 모든 게 망가졌다

RAG 파이프라인에 리랭커를 추가했습니다. 그러자마자 테스트가 실패했습니다.

버전 2에서는 FAISS와 BM25를 사용한 하이브리드 검색(hybrid retrieval)을 사용했습니다. 19개의 테스트 질문을 모두 통과했죠. 그러다 정밀도(precision)를 높이기 위해 크로스 인코더(cross-encoder) 리랭커를 추가했습니다.

이론은 간단합니다:

구현하는 데는 20분밖에 걸리지 않았습니다. 하지만 즉시 19개의 테스트 중 2개가 실패했습니다.

실패 원인은 데이터 형식 때문이었습니다. 제 데이터에는 다음과 같은 밀집된 표 형식의 청크(tabular chunks)가 포함되어 있었습니다: "Company: Zentara Robotics | CEO: Iris Kallas | Employees: 287"

크로스 인코더 모델은 자연어 문단으로 학습되었습니다. 모델이 표의 행을 보았을 때, 매우 낮은 점수를 부여했습니다. 모델은 해당 청크가 관련이 없다고 판단한 것입니다.

하이브리드 검색은 정답을 찾아냈지만, 리랭커가 이를 버려버렸습니다.

이를 해결하기 위해 7가지 방법을 시도했습니다:

어느 것도 효과가 없었습니다. 리랭커 점수가 너무 낮아서 다른 모든 요소를 압도해 버렸습니다. 모델은 단순히 순위를 낮게 매긴 것이 아니라, 표 형식을 적극적으로 거부하고 있었습니다.

저는 수학적인 문제를 해결하려는 시도를 멈추고 구조를 변경했습니다.

리랭커가 모든 것을 결정하게 두는 대신, 가장 좋은 결과들을 보호하기로 했습니다. 저는 "보장된 슬롯(guaranteed slot)" 전략을 사용했습니다:

이렇게 하면 하이브리드 검색 결과가 최종 리스트에 포함되도록 보장할 수 있습니다. 리랭커는 나머지 슬롯의 품질을 높이는 역할만 수행합니다.

결과: 19/19 테스트 통과.

배운 점:

리랭커를 찾기 전에 강력한 검색기(retriever)를 먼저 구축하세요.

Optional learning community: https://t.me/GyaanSetuAi