Utafutaji wa Mseto na Uangalizi wa Wakala
Mifumo mingi ya RAG hushindwa wakati wa utendaji (production). Haishindwi kwa sababu ya modeli ya lugha. Inashindwa wakati wa utafutaji (retrieval).
Mfumo hushindwa kupata kipande sahihi cha data. Au unapata data lakini inafichika katika nafasi ya 40. Kijenereta (generator) hakioni habari hiyo kamwe. Timu yako haina njia ya kuona nini kimeenda mrama.
Muundo huu unatatua matatizo yote mawili.
Fuata hatua hizi tatu kwa matokeo bora:
Tumia Utafutaji wa Mseto (Hybrid Retrieval) Endesha BM25 ya kileksika (lexical) na utafutaji wa kimaana (dense semantic search) kwa wakati mmoja. Tumia reciprocal rank fusion ili kuunganisha orodha hizo. Vipimo (benchmarks) vinaonyesha kuwa hii huongeza asilimia 8 kwenye Recall@5 kwenye data za maandishi na majedwali ikilinganishwa na BM25 pekee.
Ongeza Reranker Reranker ndiyo njia bora zaidi ya kuongeza usahihi (precision). Tumia cross-encoder kwenye washindani (candidates) 50 hadi 100 wa juu kabisa. Hatua hii inaboresha matokeo yako kwa kiasi kikubwa.
Zingatia Uangalizi (Observability) Unahitaji nyayo (traces) ili kupata makosa katika mchakato wako wa utafutaji (retrieval pipeline). Bila nyayo, huwezi kurekebisha mfumo.
Jenga mfumo wako wa RAG kwa viwango hivi vya utendaji (production standards).
Chanzo