Probably ने सटीक इंजीनियरिंग के साथ LLM hallucinations से निपटने के लिए $9M जुटाए

जैसे-जैसे लार्ज लैंग्वेज मॉडल्स (LLMs) पेशेवर वर्कफ़्लो में तेज़ी से एकीकृत हो रहे हैं, उद्योग को एक निरंतर बाधा का सामना करना पड़ रहा है: सबसे उन्नत मॉडल्स में भी hallucinations (मतिभ्रम) करने की प्रवृत्ति। स्टार्टअप Probably इस चुनौती का डटकर सामना कर रहा है, जिसने AI विश्वसनीयता के लिए अधिक कठोर और नियतात्मक (deterministic) दृष्टिकोण बनाने के लिए Andreessen Horowitz के नेतृत्व में $9 मिलियन की सीड फंडिंग सुरक्षित की है।

99.99% सटीकता की ओर बढ़ते कदम

संस्थापक Peter Elias के नेतृत्व में Probably का मुख्य मिशन LLMs की संभाव्य प्रकृति (probabilistic nature) और नियतात्मक प्रणालियों (deterministic systems) से अपेक्षित 99.99% सटीकता के मानक के बीच के अंतर को पाटना है। उच्च-जोखिम वाले वातावरण में, एक एकल तथ्यात्मक त्रुटि भी AI टूल को बेकार बना सकती है। इसे हल करने के लिए, Probably इस विचार से दूर जा रहा है कि सटीकता पूरी तरह से मॉडल के आकार का परिणाम है, और इसके बजाय "हार्नेस इंजीनियरिंग" (harness engineering) पर ध्यान केंद्रित कर रहा है।

कंपनी का प्रमुख उत्पाद एक डेटा साइंस टूल है जिसे जटिल डेटासेट से अंतर्दृष्टि (insights) निकालने के लिए डिज़ाइन किया गया है। मानक चैटबॉट्स के विपरीत, जो संवादात्मक प्रतिक्रियाएं प्रदान करते हैं, Probably का टूल प्रत्येक उत्तर के साथ एक विशिष्ट साइटेशन (citation) और एक पारदर्शी ऑडिट ट्रेल प्रदान करता है, जिससे उपयोगकर्ता प्रत्येक आउटपुट के पीछे के तर्क को सत्यापित कर सकते हैं।

"डेटा साइंस मेक सूट" (Data Science Mech Suit) आर्किटेक्चर

केवल एक विशाल मॉडल की तर्क करने की क्षमता पर निर्भर रहने के बजाय, Probably उस चीज़ का उपयोग करता है जिसे Elias "डेटा साइंस मेक सूट" (data science mech suit) कहते हैं। यह आर्किटेक्चर एक विस्तृत हार्नेस सिस्टम के रूप में कार्य करता है जहाँ LLM के प्रारंभिक आउटपुट की तुरंत एक नियतात्मक वैलिडेटर (deterministic validator) द्वारा सूक्ष्मता से जांच की जाती है।

यदि LLM ऐसा परिणाम देता है जो अंतर्निहित डेटासेट के साथ पूरी तरह मेल नहीं खाता है, तो वैलिडेटर उसे खारिज कर देता है। महत्वपूर्ण बात यह है कि LLM को विशेष रूप से इस वैलिडेटर के विरुद्ध प्रशिक्षित किया जाता है, जिससे गति और तथ्यात्मक अखंडता के लिए अनुकूलित एक क्लोज्ड-लूप सिस्टम बनता है। यह दृष्टिकोण एक मौलिक सिद्धांत पर काम करता है: इंजीनियरिंग के माध्यम से संदर्भ को परिष्कृत करके और अस्पष्टता को कम करके, आप भारी कम्प्यूटेशनल शक्ति (brute force) की आवश्यकता के बिना मॉडल को "सही काम करने" के लिए मजबूर कर सकते हैं।

छोटे, स्थानीय मॉडल्स के माध्यम से दक्षता

Probably के दृष्टिकोण के सबसे महत्वपूर्ण तकनीकी निहितार्थों में से एक छोटे, अधिक कुशल मॉडल्स का उपयोग करने की क्षमता है। क्योंकि "मेक सूट" (mech suit) वैलिडेशन और संदर्भ परिष्करण का मुख्य कार्य (heavy lifting) संभालता है, इसलिए सिस्टम उन मॉडल्स पर काम कर सकता है जो "फ्रंटियर मॉडल्स की तुलना में चार श्रेणी कमजोर" हैं।

इस बदलाव के व्यापक आर्थिक और परिचालन लाभ हैं:

बड़े AI लैब प्रोत्साहन मॉडल को चुनौती देना

एलियास वर्तमान AI परिदृश्य में एक संरचनात्मक असंतुलन की ओर इशारा करते हैं: प्रमुख AI लैब को विशाल, सामान्य-उद्देश्य वाले मॉडल बनाने के लिए प्रोत्साहित किया जाता है जिनमें बार-बार उपयोगकर्ता सुधार की आवश्यकता होती है। चूंकि ये लैब अक्सर टोकन उपयोग के आधार पर शुल्क लेती हैं, इसलिए अधिक त्रुटियां और अधिक फॉलो-अप प्रश्न वास्तव में राजस्व बढ़ा सकते हैं। स्केल के बजाय इंजीनियरिंग के माध्यम से सटीकता और "अस्पष्टता को कम करने" पर ध्यान केंद्रित करके, Probably मिशन-क्रिटिकल AI अनुप्रयोगों के लिए एक विशेष स्थान (niche) बना रहा है जहाँ विश्वसनीयता ही एकमात्र महत्वपूर्ण मानक है।

मुख्य निष्कर्ष