Mbinu za RAG za Juu si Bora Zaidi. Ni Bora Wakati Mwingine Tu.

Mbinu za RAG za juu si maboresho ya bure. Ni zana zenye faida na hasara (tradeoffs).

Nilijaribu mbinu tano za upatikanaji (retrieval) kwenye mfumo wa RAG nikitumia hati za Anthropic. Nilitaka kuona ni zipi ambazo kwa kweli zinastahili utata wake.

Hapa ndipo nilipopata:

• Dense Retrieval: Msingi. Inafanya kazi vizuri lakini inakosa maneno sahihi kabisa. • Hybrid Search: Inatumia dense pamoja na utafutaji wa maneno muhimu (keyword search). Inapata maneno sahihi ambayo dense inayakosa. Lakini lazima uzitoe matokeo (weight) kwa usahihi vinginevyo ishara inapotea. • Reranking: Inatumia cross-encoder kupima wagombea. Inasaidia wakati kipande (chunk) sahihi kimefichika chini sana kwenye matokeo. • HyDE: Inatumia jibu la kufikirika (hypothetical answer) kupata data. Hii ni hatari. Inasaidia maswali ya kawaida. Lakini kwenye maswali ya moja kwa moja, inaharibu kila kitu. Recall ilishuka kutoka 0.80 hadi 0.17 katika jaribio moja. • Contextual Retrieval: Inaongeza muhtasari kwenye vipande (chunks). Hii inasaidia vipande vifupi lakini inagharimu zaidi katika ada za LLM.

Somo kubwa ni kuhusu HyDE. Si zana ya "iweke na uisahau" (set and forget). Unapaswa kuitumia tu wakati swali la mtumiaji na nyaraka zako zinazungumza lugha tofauti. Unahitaji router ili kuamua wakati wa kuitumia.

Pia nilijifunza somo kuhusu upimaji.

Nilijaribu kutumia Ragas kwa ajili ya tathmini. Ilikuwa nzito sana. Ilitumia saa nyingi kujaribu tena simu (calls) zilizofeli. Niliamua kutengeneza mfumo wangu wa async harness. Badala ya saa 11, tathmini yangu ilichukua sekunde 221.

Usichukulie zana za AI kama sanduku jeusi (black boxes). Ikiwa zana ni nzito au inafeli, angalia hisabati iliyo nyuma yake. Tengeneza suluhisho lako mwenyewe ikiwa ni lazima.

Kazi si kuongeza tu vipengele vipya. Kazi ni kupima ni kipengele gani kinastahili nafasi yake katika mfumo wako.

Muhtasari wa wakati wa kutumia kila moja:

  • Hybrid: Tumia wakati maswali yanategemea vigezo sahihi (exact parameters).
  • HyDE: Tumia wakati maswali yameandikwa vibaya.
  • Reranking: Tumia wakati upatikanaji (retrieval) ni mpana lakini hauna usahihi.
  • Contextual: Tumia wakati vipande (chunks) vyako vinakosa muktadha.

Acha kukimbiziana na "state of the art." Anza kupima matokeo yako.

Chanzo: https://dev.to/yogesh23012001/advanced-rag-techniques-arent-better-theyre-better-sometimes-4m2o

Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi