Patronus AI Secures $50M to Build Digital Worlds for Agent Stress Testing

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialગયા અઠવાડિયે3min read

Patronus AI Secures $50M to Build Digital Worlds for Agent Stress Testing

In this article

એજન્ટ સ્ટ્રેસ-ટેસ્ટિંગ માટે ડિજિટલ દુનિયા બનાવવા માટે Patronus AI એ $50M મેળવ્યા

જેમ જેમ AI એજન્ટ્સ સાદા ચેટ ઇન્ટરફેસથી જટિલ, બહુ-પગલાંવાળા કાર્યો કરવા સક્ષમ સ્વાયત્ત (autonomous) અસ્તિત્વ તરફ આગળ વધી રહ્યા છે, તેમ ઉદ્યોગ એક ગંભીર અવરોધનો સામનો કરી રહ્યો છે: વિશ્વસનીયતા. Patronus AI વાસ્તવિક દુનિયામાં પ્રવેશતા પહેલા આ એજન્ટોનું સ્ટ્રેસ-ટેસ્ટ કરવા માટે રચાયેલ અત્યાધુનિક સિમ્યુલેટેડ વાતાવરણ બનાવીને આ પડકારનો સામનો કરી રહ્યું છે.

સ્ટેટિક બેન્ચમાર્કથી આગળ વધવું

વર્ષોથી, AI લેબ્સ મોડેલની ક્ષમતા દર્શાવવા માટે પ્રમાણિત બેન્ચમાર્ક પર આધાર રાખતી આવી છે. જોકે, આ સ્ટેટિક ટેસ્ટમાં ઊંચા સ્કોર ઘણીવાર વાસ્તવિક દુનિયાની ક્ષમતામાં પરિવર્તિત થવામાં નિષ્ફળ જાય છે. એક એજન્ટ લેખિત પરીક્ષા પાસ કરી શકે છે પરંતુ જ્યારે તેને લાઈવ વેબસાઇટ નેવિગેટ કરવા અથવા જટિલ નાણાકીય વર્કફ્લોનું સંચાલન કરવાનું કામ સોંપવામાં આવે ત્યારે તે નિષ્ફળ જઈ શકે છે.

ભૂતપૂર્વ Meta AI સંશોધકો આનંદ કન્નાપ્પન અને રેબેકા ક્વાન દ્વારા 2023 માં સ્થાપિત, Patronus AI લક્ષ્યો બદલી રહ્યું છે. સ્ટેટિક પ્રશ્નોને બદલે, સ્ટાર્ટઅપ વેબસાઇટ્સ અને આંતરિક એન્ટરપ્રાઇઝ સિસ્ટમ્સની હાઇ-ફિડેલિટી નકલ બનાવવા માટે "ડિજિટલ વર્લ્ડ મોડલ્સ" નો ઉપયોગ કરે છે. આ વાતાવરણ એજન્ટોને એવા સેન્ડબોક્સમાં કામ કરવાની મંજૂરી આપે છે જે વાસ્તવિક દુનિયાની અનિશ્ચિતતાની નકલ કરે છે, જે સુનિશ્ચિત કરે છે કે તેઓ વાસ્તવિક દુનિયાને નુકસાન પહોંચાડવાનું જોખમ લીધા વિના એજ કેસ (edge cases) હેન્ડલ કરી શકે.

AI એજન્ટ્સ માટે "Waymo અભિગમ"

Patronus AI પાછળનું મુખ્ય ઇનોવેશન આ કૃત્રિમ ડિજિટલ દુનિયામાં રિઇન્ફોર્સમેન્ટ લર્નિંગના ઉપયોગમાં રહેલું છે. કંપની Waymo કેવી રીતે સ્વાયત્ત વાહનોને તાલીમ આપે છે તેની સાથે સીધી સમાનતા દર્શાવે છે: જેમ Waymo ખરાબ હવામાન અથવા અચાનક રાહદારીઓની હિલચાલ જેવા દુર્લભ જોખમો સામે સેલ્ફ-ડ્રાઇવિંગ કારને ખુલ્લી પાડવા માટે સિમ્યુલેશનનો ઉપયોગ કરે છે, તેમ Patronus AI એજન્ટોને અનિશ્ચિત પરિસ્થિતિઓ સામે ખુલ્લા પાડે છે.

વર્તમાન AI એજન્ટો સાથેનો એક મોટો પ્રશ્ન એ છે કે તેઓ "શોર્ટકટ" લેવાનો પ્રયત્ન કરે છે—એવો રસ્તો શોધવો જે ટેકનિકલી સબ-ટાસ્ક પૂર્ણ કરી શકે છે પરંતુ મુખ્ય ઉદ્દેશ્યમાં નિષ્ફળ જાય છે અથવા સુરક્ષા પ્રોટોકોલનું ઉલ્લંઘન કરે છે. Patronus નું સિમ્યુલેશન વાતાવરણ ખાસ કરીને આ "હેક્સ" (hacks) ને શોધવા માટે એન્જિનિયર્ડ કરવામાં આવ્યું છે, જે ભૂલો માટે દંડ કરીને અને સાચા કામ પૂર્ણ કરવા માટે પુરસ્કાર આપીને મોડેલ્સને જવાબદાર બનાવે છે.

ઝડપી વૃદ્ધિ અને જટિલતાનું સ્કેલિંગ

આવા કડક મૂલ્યાંકન માટે બજારમાં ભારે માંગ છે. Patronus AI એ છેલ્લા એક વર્ષમાં આવકમાં 15 ગણો વધારો નોંધાવ્યો છે, જે સૂચવે છે કે ફ્રન્ટિયર AI લેબ્સ અને ઉભરતા સ્ટાર્ટઅપ્સ ઓટોમેટેડ, સ્કેલેબલ ટેસ્ટિંગ માટે આતુર છે. આ ગતિ Greenfield Partners ના નેતૃત્વમાં $50 મિલિયનના Series B ફંડિંગ રાઉન્ડમાં પરિણમી છે, જેમાં Notable Capital, Lightspeed, Datadog અને Samsung ની સહભાગીતા સાથે તેમનું કુલ ફંડિંગ $70 મિલિયન સુધી પહોંચ્યું છે.

હાલમાં, કંપની સોફ્ટવેર એન્જિનિયરિંગ અને ફાઇનાન્સ જેવા અત્યંત ચકાસી શકાય તેવા ક્ષેત્રો પર ધ્યાન કેન્દ્રિત કરી રહી છે. જોકે, ટેકનિકલ રોડમેપ મહત્વાકાંક્ષી છે. સહ-સ્થાપક આનંદ કન્નાપ્પન નોંધે છે કે ધ્યેય એવા વાતાવરણ બનાવવા છે જ્યાં એજન્ટો લાંબા સમય સુધી—10 કલાકથી 10 અઠવાડિયા સુધી—સ્વાયત્ત રીતે કામ કરી શકે, જેથી લાંબા ગાળાના તર્ક અને સુસંગતતાનું પરીક્ષણ કરી શકાય.

AI ઇકોસિસ્ટમ માટે આ શા માટે મહત્વનું છે

જ્યારે Mercor અને Surge જેવી 'હ્યુમન-ઇન-ધ-લૂપ' કંપનીઓ રિઇન્ફોર્સમેન્ટ લર્નિંગ માટે મૂલ્યવાન ડેટા પૂરો પાડે છે, ત્યારે Patronus AI સ્વાયત્ત મૂલ્યાંકનને સક્ષમ કરીને એક અનન્ય સ્થાન ધરાવે છે. ટેસ્ટિંગ લૂપમાંથી માનવીને દૂર કરીને, તેઓ સ્કેલ અને આવૃત્તિનું એવું સ્તર પ્રદાન કરે છે જે મેન્યુઅલ ટેસ્ટિંગ ક્યારેય મેળવી શકતું નથી. જેમ જેમ આપણે એજન્ટિક વર્કફ્લોના યુગ તરફ આગળ વધી રહ્યા છીએ, તેમ કડક, ઓટોમેટેડ સિમ્યુલેશન દ્વારા એજન્ટની વિશ્વસનીયતા પ્રમાણિત કરવાની ક્ષમતા ડિપ્લોયમેન્ટ માટે ગોલ્ડ સ્ટાન્ડર્ડ બની જશે.

મુખ્ય મુદ્દાઓ

સિમ્યુલેટેડ સ્ટ્રેસ-ટેસ્ટિંગ: Patronus AI સ્વાયત્ત એજન્ટ મૂલ્યાંકન માટે વેબસાઇટ્સ અને સિસ્ટમ્સની વાસ્તવિક નકલ બનાવવા માટે "ડિજિટલ વર્લ્ડ મોડલ્સ" નો ઉપયોગ કરે છે.
મોટું મૂડી રોકાણ: વાર્ષિક આવકમાં 15 ગણા વધારાને કારણે $50M ના Series B રાઉન્ડ સાથે સ્ટાર્ટઅપનું કુલ ફંડિંગ $70M થયું છે.
જવાબદારી પર ધ્યાન: સ્ટેટિક બેન્ચમાર્કથી વિપરીત, Patronus એવા "શોર્ટકટ્સ" અને "હેક્સ" ને ઓળખે છે જેનો ઉપયોગ એજન્ટો જટિલ તર્કને બાયપાસ કરવા માટે કરે છે, જે સાચી વિશ્વસનીયતા સુનિશ્ચિત કરે છે.

Patronus AI Secures $50M to Build Digital Worlds for Agent Stress Testing

એજન્ટ સ્ટ્રેસ-ટેસ્ટિંગ માટે ડિજિટલ દુનિયા બનાવવા માટે Patronus AI એ $50M મેળવ્યા

સ્ટેટિક બેન્ચમાર્કથી આગળ વધવું

AI એજન્ટ્સ માટે "Waymo અભિગમ"

ઝડપી વૃદ્ધિ અને જટિલતાનું સ્કેલિંગ

AI ઇકોસિસ્ટમ માટે આ શા માટે મહત્વનું છે

મુખ્ય મુદ્દાઓ

Continue reading

Pramaana Labs Secures $27M to Solve AI Reliability with Formal Verification

AWS Launches New Services to Solve AI Agent Security and Context Gaps

500 દિવસના સ્ટાર્ટઅપ સિમ્યુલેશનમાં માત્ર ત્રણ AI મોડલ્સ જ બચી શક્યા

એજન્ટિક AI નો ઉદય: ટેક ટીમો ઓટોમેશનના ક્ષેત્રમાં શા માટે નેતૃત્વ કરી રહી છે

Why Standard AI Benchmarks Systematically Underestimate Agent Capabilities