LLM मतिभ्रम (hallucinations) से निपटने के लिए प्रिसिजन इंजीनियरिंग के साथ शायद $9M जुटाए

📅3 hours ago⏱3 min read

In this article

Probably ने सटीक इंजीनियरिंग के साथ LLM hallucinations से निपटने के लिए $9M जुटाए

जैसे-जैसे लार्ज लैंग्वेज मॉडल्स (LLMs) पेशेवर वर्कफ़्लो में तेज़ी से एकीकृत हो रहे हैं, उद्योग को एक निरंतर बाधा का सामना करना पड़ रहा है: सबसे उन्नत मॉडल्स में भी hallucinations (मतिभ्रम) करने की प्रवृत्ति। स्टार्टअप Probably इस चुनौती का डटकर सामना कर रहा है, जिसने AI विश्वसनीयता के लिए अधिक कठोर और नियतात्मक (deterministic) दृष्टिकोण बनाने के लिए Andreessen Horowitz के नेतृत्व में $9 मिलियन की सीड फंडिंग सुरक्षित की है।

99.99% सटीकता की ओर बढ़ते कदम

संस्थापक Peter Elias के नेतृत्व में Probably का मुख्य मिशन LLMs की संभाव्य प्रकृति (probabilistic nature) और नियतात्मक प्रणालियों (deterministic systems) से अपेक्षित 99.99% सटीकता के मानक के बीच के अंतर को पाटना है। उच्च-जोखिम वाले वातावरण में, एक एकल तथ्यात्मक त्रुटि भी AI टूल को बेकार बना सकती है। इसे हल करने के लिए, Probably इस विचार से दूर जा रहा है कि सटीकता पूरी तरह से मॉडल के आकार का परिणाम है, और इसके बजाय "हार्नेस इंजीनियरिंग" (harness engineering) पर ध्यान केंद्रित कर रहा है।

कंपनी का प्रमुख उत्पाद एक डेटा साइंस टूल है जिसे जटिल डेटासेट से अंतर्दृष्टि (insights) निकालने के लिए डिज़ाइन किया गया है। मानक चैटबॉट्स के विपरीत, जो संवादात्मक प्रतिक्रियाएं प्रदान करते हैं, Probably का टूल प्रत्येक उत्तर के साथ एक विशिष्ट साइटेशन (citation) और एक पारदर्शी ऑडिट ट्रेल प्रदान करता है, जिससे उपयोगकर्ता प्रत्येक आउटपुट के पीछे के तर्क को सत्यापित कर सकते हैं।

"डेटा साइंस मेक सूट" (Data Science Mech Suit) आर्किटेक्चर

केवल एक विशाल मॉडल की तर्क करने की क्षमता पर निर्भर रहने के बजाय, Probably उस चीज़ का उपयोग करता है जिसे Elias "डेटा साइंस मेक सूट" (data science mech suit) कहते हैं। यह आर्किटेक्चर एक विस्तृत हार्नेस सिस्टम के रूप में कार्य करता है जहाँ LLM के प्रारंभिक आउटपुट की तुरंत एक नियतात्मक वैलिडेटर (deterministic validator) द्वारा सूक्ष्मता से जांच की जाती है।

यदि LLM ऐसा परिणाम देता है जो अंतर्निहित डेटासेट के साथ पूरी तरह मेल नहीं खाता है, तो वैलिडेटर उसे खारिज कर देता है। महत्वपूर्ण बात यह है कि LLM को विशेष रूप से इस वैलिडेटर के विरुद्ध प्रशिक्षित किया जाता है, जिससे गति और तथ्यात्मक अखंडता के लिए अनुकूलित एक क्लोज्ड-लूप सिस्टम बनता है। यह दृष्टिकोण एक मौलिक सिद्धांत पर काम करता है: इंजीनियरिंग के माध्यम से संदर्भ को परिष्कृत करके और अस्पष्टता को कम करके, आप भारी कम्प्यूटेशनल शक्ति (brute force) की आवश्यकता के बिना मॉडल को "सही काम करने" के लिए मजबूर कर सकते हैं।

छोटे, स्थानीय मॉडल्स के माध्यम से दक्षता

Probably के दृष्टिकोण के सबसे महत्वपूर्ण तकनीकी निहितार्थों में से एक छोटे, अधिक कुशल मॉडल्स का उपयोग करने की क्षमता है। क्योंकि "मेक सूट" (mech suit) वैलिडेशन और संदर्भ परिष्करण का मुख्य कार्य (heavy lifting) संभालता है, इसलिए सिस्टम उन मॉडल्स पर काम कर सकता है जो "फ्रंटियर मॉडल्स की तुलना में चार श्रेणी कमजोर" हैं।

इस बदलाव के व्यापक आर्थिक और परिचालन लाभ हैं:

कम टोकन लागत: छोटे मॉडल प्रति-क्वेरी लागत को काफी कम कर देते हैं, जो एक महत्वपूर्ण कारक है क्योंकि उद्यम AI बजट को अनुकूलित करने की कोशिश कर रहे हैं।
स्थानीय निष्पादन (Local Execution): ये हल्के मॉडल महंगे और हाई-लेटेंसी वाले डेटा सेंटर कनेक्शनों के बजाय डेस्कटॉप कंप्यूटर जैसे स्थानीय हार्डवेयर पर चल सकते हैं।
स्केलेबिलिटी (Scalability): इस इंजन को डेटा साइंस से आगे बढ़कर अकाउंटिंग और मेडिकल सेवाओं जैसे सटीकता-संवेदनशील क्षेत्रों में विस्तार करने के लिए डिज़ाइन किया गया है।

बड़े AI लैब प्रोत्साहन मॉडल को चुनौती देना

एलियास वर्तमान AI परिदृश्य में एक संरचनात्मक असंतुलन की ओर इशारा करते हैं: प्रमुख AI लैब को विशाल, सामान्य-उद्देश्य वाले मॉडल बनाने के लिए प्रोत्साहित किया जाता है जिनमें बार-बार उपयोगकर्ता सुधार की आवश्यकता होती है। चूंकि ये लैब अक्सर टोकन उपयोग के आधार पर शुल्क लेती हैं, इसलिए अधिक त्रुटियां और अधिक फॉलो-अप प्रश्न वास्तव में राजस्व बढ़ा सकते हैं। स्केल के बजाय इंजीनियरिंग के माध्यम से सटीकता और "अस्पष्टता को कम करने" पर ध्यान केंद्रित करके, Probably मिशन-क्रिटिकल AI अनुप्रयोगों के लिए एक विशेष स्थान (niche) बना रहा है जहाँ विश्वसनीयता ही एकमात्र महत्वपूर्ण मानक है।

मुख्य निष्कर्ष

डिटरमिनिस्टिक वैलिडेशन (Deterministic Validation): Probably 99.99% सटीकता का लक्ष्य रखते हुए, LLM आउटपुट की डिटरमिनिस्टिक वैलिडेटर के साथ जांच करने के लिए "mech suit" आर्किटेक्चर का उपयोग करता है।
लागत प्रभावी इंजीनियरिंग: बेहतर कॉन्टेक्स्ट इंजीनियरिंग के माध्यम से अस्पष्टता को कम करके, सिस्टम बहुत छोटे और सस्ते मॉडल पर चल सकता है जो स्थानीय हार्डवेयर पर काम कर सकते हैं।
सटीकता-प्रथम फोकस: इस तकनीक को AI को चिकित्सा और वित्त जैसे उच्च-जोखिम वाले, सटीकता-संवेदनशील उद्योगों में ले जाने के लिए डिज़ाइन किया गया है जहाँ hallucinations (भ्रम) अस्वीकार्य हैं।

LLM मतिभ्रम (hallucinations) से निपटने के लिए प्रिसिजन इंजीनियरिंग के साथ शायद $9M जुटाए

Probably ने सटीक इंजीनियरिंग के साथ LLM hallucinations से निपटने के लिए $9M जुटाए

99.99% सटीकता की ओर बढ़ते कदम

"डेटा साइंस मेक सूट" (Data Science Mech Suit) आर्किटेक्चर

छोटे, स्थानीय मॉडल्स के माध्यम से दक्षता

बड़े AI लैब प्रोत्साहन मॉडल को चुनौती देना

मुख्य निष्कर्ष

Continue reading

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

AI रेड टीमिंग: प्रतिकूल जोखिमों से लार्ज लैंग्वेज मॉडल्स को सुरक्षित करना

𝗠𝗔 𝗣𝗿𝗼𝗼𝗳𝗕𝗲𝗻𝗰𝗵: 𝗚𝗣𝗧 𝟱.𝟱 𝗛𝗶𝘁𝘀 𝟭𝟲% 𝗼𝗻 𝗠𝗮𝘁𝗵 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴