𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial5 മണിക്കൂർ മുമ്പ്2min read

നിങ്ങളുടെ RAG സിസ്റ്റം എന്തുകൊണ്ട് Hallucinate ചെയ്യുന്നു

നിങ്ങളുടെ RAG സിസ്റ്റത്തിന് 34% retrieval accuracy മാത്രമേയുള്ളൂ. നിങ്ങൾ എല്ലാ ട്യൂട്ടോറിയലുകളും പിന്തുടർന്നു. ശരിയായ ലൈബ്രറികൾ ഉപയോഗിച്ചു. ഒരു ബ്ലോഗ് പോസ്റ്റിൽ നിന്ന് chunk size തിരഞ്ഞെടുത്തു. എന്നിട്ടും, സിസ്റ്റം പരാജയപ്പെടുന്നു.

ഇതൊരു tooling പ്രശ്നമല്ല. ഇതൊരു fundamentals പ്രശ്നമാണ്.

അവയ്ക്ക് താഴെയുള്ള പാളികളെക്കുറിച്ച് (layers) മനസ്സിലാക്കാതെ നിങ്ങൾ ലൈബ്രറികൾ കൂട്ടിവെക്കുമ്പോൾ, നിങ്ങൾ ഒരു abstraction debt സൃഷ്ടിക്കുന്നു. നിങ്ങൾക്ക് വേഗത ലഭിക്കുന്നുണ്ടെങ്കിലും debug ചെയ്യാനുള്ള കഴിവ് നഷ്ടപ്പെടുന്നു. നിങ്ങൾ ഒരു black box ആണ് നിർമ്മിക്കുന്നത്.

നിങ്ങളുടെ RAG pipeline ശരിയാക്കാൻ, നിങ്ങൾ മൂന്ന് പാളികളിൽ (layers) വൈദഗ്ധ്യം നേടണം:

Chunking Strategy Chunk size എന്നത് ഒരു semantic തീരുമാനമാണ്. നിങ്ങളുടെ chunks 512 tokens ആണെങ്കിൽ, നിങ്ങൾ paragraphs ആണ് retrieve ചെയ്യുന്നത്. നിങ്ങളുടെ ചോദ്യങ്ങൾക്ക് പല paragraphs-കളിലായി ആശയങ്ങളെ ബന്ധിപ്പിക്കേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങളുടെ chunks വളരെ ചെറുതാണ്. chunks-കൾക്കിടയിൽ എത്രത്തോളം context ഒഴുകണം എന്ന് നിങ്ങൾ തീരുമാനിക്കണം.
Embedding Models Dense embeddings അർത്ഥം പിടിച്ചെടുക്കുന്നുണ്ടെങ്കിലും കൃത്യമായ syntax നഷ്ടപ്പെട്ടേക്കാം. ഒരു മോഡൽ "error 403", "error 404" എന്നിവയെ ഏകദേശം ഒന്നുതന്നെയായി കണക്കാക്കിയേക്കാം. നിങ്ങളുടെ മോഡൽ എന്താണ് പിടിച്ചെടുക്കുന്നത് എന്ന് നിങ്ങൾ അറിഞ്ഞിരിക്കണം. ഒരു legal contract-ന് ഒരു code repository-യെക്കാൾ വ്യത്യസ്തമായ embeddings ആവശ്യമാണ്.
Retrieval vs. Recall Vector search പ്രസക്തമാകാൻ സാധ്യതയുള്ളതെല്ലാം കണ്ടെത്തുന്നു.

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

Continue reading

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗜 𝗦𝗽𝗲𝗻𝘁 $𝟱𝟬𝟬 𝗼𝗻 𝗥𝗔𝗚 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗕𝗲𝗳𝗼𝗿𝗲 𝗙𝗶𝘅𝗶𝗻𝗴 𝗧𝗵𝗲𝘀𝗲 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀

7 തെറ്റുകൾ വരുത്തുന്നതിന് മുമ്പ് RAG ഇൻഫ്രാസ്ട്രക്ചറിനായി ഞാൻ $500 ചിലവഴിച്ചു

എന്റെ RAG ആപ്പ് എന്തുകൊണ്ട് തെറ്റായ വിവരങ്ങൾ നൽകി? ഞാൻ അത് എങ്ങനെ പരിഹരിച്ചു?

𝗪𝗵𝘆 𝗠𝘆 𝗥𝗔𝗚 𝗔𝗽𝗽 𝗞𝗲𝗽𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴 𝗔𝗻𝗱 𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗜𝘁