मी माझ्या लोकल RAG मध्ये हॅलुसिनेशन पकडण्यासाठी एक व्हेरिफाय लेयर जोडला
मी Ollama वापरून एक लोकल रिसर्च असिस्टंट तयार केला आहे. तो माझ्या स्वतःच्या पेपर्सवर चालतो. माझ्या मशीनबाहेर कोणतीही माहिती जात नाही.
मला हॅलुसिनेशन (hallucinations) थांबवायचे होते. एखादे साधन जे खात्रीशीर वाटत असताना चुकीचा आकडा सांगते, ते धोकादायक असते.
मी एक व्हेरिफिकेशन लेयर जोडला. तो तीन टप्प्यांत काम करतो:
- उत्तराचे लहान दाव्यांमध्ये (claims) विभाजन करणे.
- प्रत्येक दावा सोर्सशी (source) जुळतो का हे तपासण्यासाठी LLM वापरणे.
- सोर्स ज्या दाव्यांना समर्थन देत नाही, त्यांना फ्लॅग (flag) करणे.
या निकालांनी मला एक कठीण धडा शिकवला. मी माझ्या स्वतःच्या डेटाबद्दल दोनदा चुकत होतो.
पहिले म्हणजे, मॉडेलने एक खरा आकडा दिला पण चुकीचा संदर्भ (context) वापरला. त्याने अस्तित्वात नसलेल्या टेस्ट सेटसाठी 0.804 चा AUROC सांगितला. आकडा खरा होता, पण संदर्भ खोटा होता. माझ्या व्हेरिफायरने त्याला पास केले कारण अंक जुळत होते.
दुसरे म्हणजे, मॉडेलने पेपरच्या दुसऱ्या भागातून एक आकडा घेतला. त्याने चुकीच्या प्रयोगाला एक व्हॅल्यू (value) जोडली.
हे टेस्टिंग केल्यावर मी काय शिकलो ते खालीलप्रमाणे आहे:
व्हेरिफिकेशन फक्त अनुपस्थित मूल्ये (absent values) पकडते. जर एखादा आकडा मजकुरात अजिबात नसेल, तर व्हेरिफायर तो पकडतो. पण जर आकडा खरा असेल पण तो चुकीच्या तथ्याशी जोडलेला असेल, तर व्हेरिफायर अनेकदा अपयशी ठरतो.
एकाच मॉडेलचे जज (judges) असल्यास त्यांच्या काही मर्यादा (blind spots) असतात. जर तेच मॉडेल उत्तर लिहित असेल आणि तेच उत्तर तपासत असेल, तर ते स्वतःच्या चुकांनाही मान्यता देते. चुकीचे संदर्भ असलेले आकडे पकडण्यासाठी वेगळे मॉडेल वापरणे फायदेशीर ठरते.
फ्लॅगचा अर्थ नेहमीच खोटेपणा असा होत नाही. फ्लॅगचे तीन अर्थ असू शकतात:
- खरे हॅलुसिनेशन.
- रिट्रिव्हल एरर (retrieval error), जिथे सोर्स सापडला नाही.
- एक सत्य तथ्य जे रिट्रिव्हल केलेल्या मजकुरात नव्हते. जेव्हा तुम्हाला फ्लॅग दिसेल, तेव्हा फक्त तो दावा काढून टाकण्याऐवजी डेटा पुन्हा रिट्रिव्हल (re-retrieving) करण्याचा प्रयत्न करा.
- तुम्हाला 'ग्राउंड ट्रुथ' (ground truth) आवश्यक आहे. खरी उत्तरे माहित असल्याशिवाय तुम्ही हॅलुसिनेशन मोजू शकत नाही. मी माझ्या स्वतःच्या कामाबद्दल दोन चुकीचे निष्कर्ष जवळजवळ प्रसिद्ध केले होते. माझ्या फाईल्समध्ये साध्या शोधाने दोन्ही चुका सुधारल्या गेल्या.
तुमच्या RAG साठी काही व्यावहारिक सल्ला:
- उत्तर देणाऱ्या मॉडेलपेक्षा वेगळे मॉडेल जज म्हणून वापरा.
- चांगल्या रिट्रिव्हलवर (retrieval) लक्ष केंद्रित करा. बहुतेक "हॅलुसिनेशन" हे केवळ रिट्रिव्हल फेल्युअर असतात.
- फ्लॅग्सना केवळ त्रुटीचे चिन्ह न मानता, अधिक सखोल तपासणी करण्यासाठी एक संकेत (prompt) म्हणून पहा.
पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi