एजंट स्ट्रेस-टेस्टिंगसाठी डिजिटल जग निर्माण करण्यासाठी Patronus AI ने $50M उभारले

जसे AI एजंट्स साध्या चॅट इंटरफेसपासून जटिल, बहु-स्तरीय कार्ये करण्यास सक्षम असलेल्या स्वायत्त संस्थांकडे (autonomous entities) वळत आहेत, तसतसे उद्योगासमोर एक गंभीर अडथळा येत आहे: विश्वसनीयता. Patronus AI या आव्हानावर मात करण्यासाठी प्रगत सिम्युलेटेड वातावरण (simulated environments) तयार करत आहे, जे हे एजंट्स वास्तविक जगात येण्यापूर्वी त्यांचे स्ट्रेस-टेस्टिंग करण्यासाठी डिझाइन केलेले आहे.

स्टॅटिक बेंचमार्क्सच्या पलीकडे जाणे

अनेक वर्षांपासून, AI लॅब्स मॉडेलची क्षमता सिद्ध करण्यासाठी प्रमाणित बेंचमार्क्सवर अवलंबून आहेत. तथापि, या स्टॅटिक टेस्टमधील उच्च गुण अनेकदा वास्तविक जगातील कार्यक्षमतेत रूपांतरित होत नाहीत. एखादा एजंट लेखी परीक्षेत उत्तीर्ण होऊ शकतो, परंतु जेव्हा त्याला थेट वेबसाइटवर नेव्हिगेट करणे किंवा जटिल आर्थिक वर्कफ्लो व्यवस्थापित करणे असे काम दिले जाते, तेव्हा तो पूर्णपणे अपयशी ठरू शकतो.

माजी Meta AI संशोधक आनंद कण्णापन आणि रेबेका कियान यांनी २०२३ मध्ये स्थापन केलेली Patronus AI आता उद्दिष्टे बदलत आहे. स्टॅटिक प्रश्नांऐवजी, हे स्टार्टअप वेबसाइट्स आणि अंतर्गत एंटरप्राइझ सिस्टम्सच्या हाय-फिडेलिटी प्रतिकृती तयार करण्यासाठी "डिजिटल वर्ल्ड मॉडेल्स"चा वापर करते. ही वातावरणामुळे एजंट्सना अशा सँडबॉक्समध्ये काम करण्याची संधी मिळते जो वास्तविक जगातील अनिश्चिततेची नक्कल करतो, ज्यामुळे वास्तविक जगाचे नुकसान न होता ते 'एज केसेस' (edge cases) हाताळू शकतात याची खात्री मिळते.

AI एजंट्ससाठी "Waymo दृष्टिकोन"

Patronus AI मधील मुख्य नाविन्य हे या कृत्रिम डिजिटल जगामध्ये 'रिइन्फोर्समेंट लर्निंग'च्या (reinforcement learning) वापरामध्ये आहे. कंपनीने Waymo स्वायत्त वाहनांना (autonomous vehicles) कशा प्रकारे प्रशिक्षित करते, याच्याशी थेट समांतरता साधली आहे: ज्याप्रमाणे Waymo सिम्युलेशनचा वापर करून स्वयंचलित कारना खराब हवामान किंवा अचानक चालणाऱ्या पादचाऱ्यांच्या हालचालींसारख्या दुर्मिळ धोक्यांचा सामना करण्यास शिकवते, त्याचप्रमाणे Patronus AI एजंट्सना अनपेक्षित परिस्थितीचा सामना करण्यास तयार करते.

सध्याच्या AI एजंट्समधील एक मोठी समस्या म्हणजे "शॉर्टकट" घेण्याची त्यांची प्रवृत्ती—असा मार्ग शोधणे जो तांत्रिकदृष्ट्या उप-कार्य (sub-task) पूर्ण करू शकतो परंतु मुख्य उद्दिष्ट पूर्ण करण्यात अपयशी ठरतो किंवा सुरक्षा नियमांचे उल्लंघन करतो. Patronus चे सिम्युलेशन वातावरण विशेषतः हे "हॅक्स" शोधण्यासाठी तयार केले गेले आहे, जे चुकांसाठी दंड आकारून आणि प्रत्यक्ष कार्य पूर्ण केल्याबद्दल बक्षीस देऊन मॉडेल्सना जबाबदार धरते.

झपाट्याने वाढ आणि वाढती जटिलता

अशा कठोर मूल्यमापनाची बाजारपेठेतील मागणी प्रचंड आहे. Patronus AI ने गेल्या वर्षभरात महसुलात १५ पटीने वाढ झाल्याचे सांगितले आहे, जे दर्शवते की आघाडीचे AI लॅब्स आणि उदयोन्मुख स्टार्टअप्स स्वयंचलित आणि स्केलेबल टेस्टिंगसाठी उत्सुक आहेत. या गतीमुळे Greenfield Partners च्या नेतृत्वाखाली $50 मिलियनचा Series B फंडिंग राउंड पूर्ण झाला आहे, ज्यामध्ये Notable Capital, Lightspeed, Datadog आणि Samsung यांचा सहभाग होता, ज्यामुळे त्यांचे एकूण फंडिंग $70 मिलियनवर पोहोचले आहे.

सध्या कंपनी सॉफ्टवेअर इंजिनिअरिंग आणि फायनान्स यांसारख्या अत्यंत पडताळणीयोग्य क्षेत्रांवर लक्ष केंद्रित करत आहे. तथापि, त्यांचा तांत्रिक रोडमॅप महत्त्वाकांक्षी आहे. सह-संस्थापक आनंद कण्णापन यांनी नमूद केले की, दीर्घकालीन तर्कशक्ती आणि सुसंगतता तपासण्यासाठी एजंट्स १० तास ते १० आठवड्यांपर्यंतच्या विस्तारित कालावधीसाठी स्वायत्तपणे काम करू शकतील अशी वातावरणे तयार करणे हे त्यांचे ध्येय आहे.

AI इकोसिस्टमसाठी हे का महत्त्वाचे आहे

Mercor आणि Surge सारख्या 'ह्युमन-इन-द-लूप' (human-in-the-loop) कंपन्या रिइन्फोर्समेंट लर्निंगसाठी मौल्यवान डेटा प्रदान करत असल्या तरी, Patronus AI स्वायत्त मूल्यमापन सक्षम करून एक वेगळी जागा व्यापते. टेस्टिंगमधून मानवी हस्तक्षेप काढून टाकून, ते अशा स्तरावरील व्याप्ती आणि वारंवारता प्रदान करतात जी मॅन्युअल टेस्टिंगद्वारे शक्य नाही. आपण 'एजेंटिक वर्कफ्लो'च्या (agentic workflows) युगाकडे जात असताना, कठोर आणि स्वयंचलित सिम्युलेशनद्वारे एजंटची विश्वसनीयता प्रमाणित करण्याची क्षमता ही उपयोजनासाठी (deployment) 'गोल्ड स्टँडर्ड' बनेल.

मुख्य मुद्दे

  • सिम्युलेटेड स्ट्रेस-टेस्टिंग: Patronus AI स्वायत्त एजंट मूल्यमापनासाठी वेबसाइट्स आणि सिस्टम्सच्या वास्तववादी प्रतिकृती तयार करण्यासाठी "डिजिटल वर्ल्ड मॉडेल्स"चा वापर करते.
  • मोठी भांडवल गुंतवणूक: वार्षिक महसुलात १५ पटीने वाढ झाल्यामुळे, $50M च्या Series B राउंडमुळे स्टार्टअपचे एकूण फंडिंग $70M झाले आहे.
  • जबाबदारीवर लक्ष केंद्रित: स्टॅटिक बेंचमार्क्सच्या उलट, Patronus अशा "शॉर्टकट" आणि "हॅक्स" ओळखते जे एजंट्स जटिल तर्कशक्ती टाळण्यासाठी वापरतात, ज्यामुळे खरी विश्वसनीयता सुनिश्चित होते.