RAG मुळे AI मधील 'hallucination' ८५% ने कसे कमी होते

AI अनेकदा स्वतःच्या मनाने गोष्टी सांगते. यालाच 'hallucination' म्हणतात.

Retrieval Augmented Generation (RAG) ही समस्या सोडवते. हे AI ला अंदाज लावण्यापासून रोखते आणि त्याला प्रत्यक्ष तथ्यांकडे पाहण्यास भाग पाडते.

Pinecone कडील डेटा एक मोठा फरक दर्शवतो. जेव्हा GPT-4 ला २०२१ नंतरच्या तथ्यांबद्दल विचारले जाते, तेव्हा RAG वापरल्यामुळे hallucinationचे प्रमाण २७% वरून केवळ ४% पर्यंत खाली येते.

हे कसे कार्य करते?

RAG शिवाय असलेल्या AI कडे असा विचार करा की तो एक विद्यार्थी आहे जो केवळ स्मरणावरून (memory) परीक्षा देत आहे. जर तो एखादी गोष्ट विसरला, तर हुशार दिसण्यासाठी तो कदाचित खोटे बोलू शकतो.

RAG असलेल्या AI कडे असा विद्यार्थी म्हणून पहा जो 'open-book' परीक्षा देत आहे. उत्तर देण्यापूर्वी तो पाठ्यपुस्तकात उत्तर शोधतो.

ही प्रक्रिया खालील टप्प्यांचे अनुसरण करते:

• सिस्टम तुमच्या प्रश्नाचे vector नावाच्या गणितीय कोडमध्ये रूपांतर करते. • ती डेटाबेसमध्ये समान गणितीय कोड असलेले मजकूर तुकडे (text chunks) शोधते. • साम्य गुणांच्या (similarity scores) आधारे ती सर्वोत्तम जुळणारे भाग निवडते. • ती ही विशिष्ट माहिती तुमच्या प्रॉम्प्टमध्ये (prompt) समाविष्ट करते. • AI त्याचे उत्तर लिहिण्यासाठी पुरवलेले तथ्य वाचते. • सिस्टम तुम्हाला स्त्रोत (sources) दाखवते जेणेकरून तुम्ही त्यांची पडताळणी करू शकता.

तुमच्या कामासाठी हे का महत्त्वाचे आहे:

  • अचूकता (Accuracy): AI प्रशिक्षणादरम्यानच्या स्मरणाऐवजी प्रत्यक्ष डेटा वापरते.
  • ताजेपणा (Freshness): संपूर्ण मॉडेल पुन्हा प्रशिक्षित न करता तुम्ही AI ला आजच्या बातम्या देऊ शकता.
  • पारदर्शकता (Transparency): माहिती नेमकी कुठून आली आहे हे तुम्हाला स्पष्टपणे दिसते.
  • कमी खर्च (Low Cost): RAG द्वारे डेटाचा एक छोटा भाग प्रोसेस करण्याचा खर्च $0.002 येतो. याउलट, एक मोठा context window प्रोसेस करण्याचा खर्च $2.00 पर्यंत असू शकतो.

मोठे ब्रँड्स आधीच याचा वापर करत आहेत:

  • Perplexity AI: संदर्भांसह (citations) सर्च इंजिन म्हणून काम करण्यासाठी RAG वापरते.
  • Claude: लांब कागदपत्रांवरील खर्च वाचवण्यासाठी RAG वापरते.
  • Microsoft Copilot: तुमची फाईल्स आणि ईमेल्स वाचण्यासाठी RAG वापरते.

RAG मुळे AI एका कल्पक कथाकाराकडून (creative storyteller) एका विश्वासार्ह संशोधकाकडे (reliable researcher) रूपांतरित होते.

स्त्रोत: https://dev.to/tawan_shamsanor_30e1980a9/rag-ldkaarhlnkhng-ai-aid-85-aidyaangair-57ni