Probably ने सटीक इंजीनियरिंग के साथ LLM hallucinations से निपटने के लिए $9M जुटाए
जैसे-जैसे लार्ज लैंग्वेज मॉडल्स (LLMs) पेशेवर वर्कफ़्लो में तेज़ी से एकीकृत हो रहे हैं, उद्योग को एक निरंतर बाधा का सामना करना पड़ रहा है: सबसे उन्नत मॉडल्स में भी hallucinations (मतिभ्रम) करने की प्रवृत्ति। स्टार्टअप Probably इस चुनौती का डटकर सामना कर रहा है, जिसने AI विश्वसनीयता के लिए अधिक कठोर और नियतात्मक (deterministic) दृष्टिकोण बनाने के लिए Andreessen Horowitz के नेतृत्व में $9 मिलियन की सीड फंडिंग सुरक्षित की है।
99.99% सटीकता की ओर बढ़ते कदम
संस्थापक Peter Elias के नेतृत्व में Probably का मुख्य मिशन LLMs की संभाव्य प्रकृति (probabilistic nature) और नियतात्मक प्रणालियों (deterministic systems) से अपेक्षित 99.99% सटीकता के मानक के बीच के अंतर को पाटना है। उच्च-जोखिम वाले वातावरण में, एक एकल तथ्यात्मक त्रुटि भी AI टूल को बेकार बना सकती है। इसे हल करने के लिए, Probably इस विचार से दूर जा रहा है कि सटीकता पूरी तरह से मॉडल के आकार का परिणाम है, और इसके बजाय "हार्नेस इंजीनियरिंग" (harness engineering) पर ध्यान केंद्रित कर रहा है।
कंपनी का प्रमुख उत्पाद एक डेटा साइंस टूल है जिसे जटिल डेटासेट से अंतर्दृष्टि (insights) निकालने के लिए डिज़ाइन किया गया है। मानक चैटबॉट्स के विपरीत, जो संवादात्मक प्रतिक्रियाएं प्रदान करते हैं, Probably का टूल प्रत्येक उत्तर के साथ एक विशिष्ट साइटेशन (citation) और एक पारदर्शी ऑडिट ट्रेल प्रदान करता है, जिससे उपयोगकर्ता प्रत्येक आउटपुट के पीछे के तर्क को सत्यापित कर सकते हैं।
"डेटा साइंस मेक सूट" (Data Science Mech Suit) आर्किटेक्चर
केवल एक विशाल मॉडल की तर्क करने की क्षमता पर निर्भर रहने के बजाय, Probably उस चीज़ का उपयोग करता है जिसे Elias "डेटा साइंस मेक सूट" (data science mech suit) कहते हैं। यह आर्किटेक्चर एक विस्तृत हार्नेस सिस्टम के रूप में कार्य करता है जहाँ LLM के प्रारंभिक आउटपुट की तुरंत एक नियतात्मक वैलिडेटर (deterministic validator) द्वारा सूक्ष्मता से जांच की जाती है।
यदि LLM ऐसा परिणाम देता है जो अंतर्निहित डेटासेट के साथ पूरी तरह मेल नहीं खाता है, तो वैलिडेटर उसे खारिज कर देता है। महत्वपूर्ण बात यह है कि LLM को विशेष रूप से इस वैलिडेटर के विरुद्ध प्रशिक्षित किया जाता है, जिससे गति और तथ्यात्मक अखंडता के लिए अनुकूलित एक क्लोज्ड-लूप सिस्टम बनता है। यह दृष्टिकोण एक मौलिक सिद्धांत पर काम करता है: इंजीनियरिंग के माध्यम से संदर्भ को परिष्कृत करके और अस्पष्टता को कम करके, आप भारी कम्प्यूटेशनल शक्ति (brute force) की आवश्यकता के बिना मॉडल को "सही काम करने" के लिए मजबूर कर सकते हैं।
छोटे, स्थानीय मॉडल्स के माध्यम से दक्षता
Probably के दृष्टिकोण के सबसे महत्वपूर्ण तकनीकी निहितार्थों में से एक छोटे, अधिक कुशल मॉडल्स का उपयोग करने की क्षमता है। क्योंकि "मेक सूट" (mech suit) वैलिडेशन और संदर्भ परिष्करण का मुख्य कार्य (heavy lifting) संभालता है, इसलिए सिस्टम उन मॉडल्स पर काम कर सकता है जो "फ्रंटियर मॉडल्स की तुलना में चार श्रेणी कमजोर" हैं।
इस बदलाव के व्यापक आर्थिक और परिचालन लाभ हैं:
- कम टोकन लागत: छोटे मॉडल प्रति-क्वेरी लागत को काफी कम कर देते हैं, जो एक महत्वपूर्ण कारक है क्योंकि उद्यम AI बजट को अनुकूलित करने की कोशिश कर रहे हैं।
- स्थानीय निष्पादन (Local Execution): ये हल्के मॉडल महंगे और हाई-लेटेंसी वाले डेटा सेंटर कनेक्शनों के बजाय डेस्कटॉप कंप्यूटर जैसे स्थानीय हार्डवेयर पर चल सकते हैं।
- स्केलेबिलिटी (Scalability): इस इंजन को डेटा साइंस से आगे बढ़कर अकाउंटिंग और मेडिकल सेवाओं जैसे सटीकता-संवेदनशील क्षेत्रों में विस्तार करने के लिए डिज़ाइन किया गया है।
बड़े AI लैब प्रोत्साहन मॉडल को चुनौती देना
एलियास वर्तमान AI परिदृश्य में एक संरचनात्मक असंतुलन की ओर इशारा करते हैं: प्रमुख AI लैब को विशाल, सामान्य-उद्देश्य वाले मॉडल बनाने के लिए प्रोत्साहित किया जाता है जिनमें बार-बार उपयोगकर्ता सुधार की आवश्यकता होती है। चूंकि ये लैब अक्सर टोकन उपयोग के आधार पर शुल्क लेती हैं, इसलिए अधिक त्रुटियां और अधिक फॉलो-अप प्रश्न वास्तव में राजस्व बढ़ा सकते हैं। स्केल के बजाय इंजीनियरिंग के माध्यम से सटीकता और "अस्पष्टता को कम करने" पर ध्यान केंद्रित करके, Probably मिशन-क्रिटिकल AI अनुप्रयोगों के लिए एक विशेष स्थान (niche) बना रहा है जहाँ विश्वसनीयता ही एकमात्र महत्वपूर्ण मानक है।
मुख्य निष्कर्ष
- डिटरमिनिस्टिक वैलिडेशन (Deterministic Validation): Probably 99.99% सटीकता का लक्ष्य रखते हुए, LLM आउटपुट की डिटरमिनिस्टिक वैलिडेटर के साथ जांच करने के लिए "mech suit" आर्किटेक्चर का उपयोग करता है।
- लागत प्रभावी इंजीनियरिंग: बेहतर कॉन्टेक्स्ट इंजीनियरिंग के माध्यम से अस्पष्टता को कम करके, सिस्टम बहुत छोटे और सस्ते मॉडल पर चल सकता है जो स्थानीय हार्डवेयर पर काम कर सकते हैं।
- सटीकता-प्रथम फोकस: इस तकनीक को AI को चिकित्सा और वित्त जैसे उच्च-जोखिम वाले, सटीकता-संवेदनशील उद्योगों में ले जाने के लिए डिज़ाइन किया गया है जहाँ hallucinations (भ्रम) अस्वीकार्य हैं।