એજન્ટ સ્ટ્રેસ-ટેસ્ટિંગ માટે ડિજિટલ દુનિયા બનાવવા માટે Patronus AI એ $50M મેળવ્યા

જેમ જેમ AI એજન્ટ્સ સાદા ચેટ ઇન્ટરફેસથી જટિલ, બહુ-પગલાંવાળા કાર્યો કરવા સક્ષમ સ્વાયત્ત (autonomous) અસ્તિત્વ તરફ આગળ વધી રહ્યા છે, તેમ ઉદ્યોગ એક ગંભીર અવરોધનો સામનો કરી રહ્યો છે: વિશ્વસનીયતા. Patronus AI વાસ્તવિક દુનિયામાં પ્રવેશતા પહેલા આ એજન્ટોનું સ્ટ્રેસ-ટેસ્ટ કરવા માટે રચાયેલ અત્યાધુનિક સિમ્યુલેટેડ વાતાવરણ બનાવીને આ પડકારનો સામનો કરી રહ્યું છે.

સ્ટેટિક બેન્ચમાર્કથી આગળ વધવું

વર્ષોથી, AI લેબ્સ મોડેલની ક્ષમતા દર્શાવવા માટે પ્રમાણિત બેન્ચમાર્ક પર આધાર રાખતી આવી છે. જોકે, આ સ્ટેટિક ટેસ્ટમાં ઊંચા સ્કોર ઘણીવાર વાસ્તવિક દુનિયાની ક્ષમતામાં પરિવર્તિત થવામાં નિષ્ફળ જાય છે. એક એજન્ટ લેખિત પરીક્ષા પાસ કરી શકે છે પરંતુ જ્યારે તેને લાઈવ વેબસાઇટ નેવિગેટ કરવા અથવા જટિલ નાણાકીય વર્કફ્લોનું સંચાલન કરવાનું કામ સોંપવામાં આવે ત્યારે તે નિષ્ફળ જઈ શકે છે.

ભૂતપૂર્વ Meta AI સંશોધકો આનંદ કન્નાપ્પન અને રેબેકા ક્વાન દ્વારા 2023 માં સ્થાપિત, Patronus AI લક્ષ્યો બદલી રહ્યું છે. સ્ટેટિક પ્રશ્નોને બદલે, સ્ટાર્ટઅપ વેબસાઇટ્સ અને આંતરિક એન્ટરપ્રાઇઝ સિસ્ટમ્સની હાઇ-ફિડેલિટી નકલ બનાવવા માટે "ડિજિટલ વર્લ્ડ મોડલ્સ" નો ઉપયોગ કરે છે. આ વાતાવરણ એજન્ટોને એવા સેન્ડબોક્સમાં કામ કરવાની મંજૂરી આપે છે જે વાસ્તવિક દુનિયાની અનિશ્ચિતતાની નકલ કરે છે, જે સુનિશ્ચિત કરે છે કે તેઓ વાસ્તવિક દુનિયાને નુકસાન પહોંચાડવાનું જોખમ લીધા વિના એજ કેસ (edge cases) હેન્ડલ કરી શકે.

AI એજન્ટ્સ માટે "Waymo અભિગમ"

Patronus AI પાછળનું મુખ્ય ઇનોવેશન આ કૃત્રિમ ડિજિટલ દુનિયામાં રિઇન્ફોર્સમેન્ટ લર્નિંગના ઉપયોગમાં રહેલું છે. કંપની Waymo કેવી રીતે સ્વાયત્ત વાહનોને તાલીમ આપે છે તેની સાથે સીધી સમાનતા દર્શાવે છે: જેમ Waymo ખરાબ હવામાન અથવા અચાનક રાહદારીઓની હિલચાલ જેવા દુર્લભ જોખમો સામે સેલ્ફ-ડ્રાઇવિંગ કારને ખુલ્લી પાડવા માટે સિમ્યુલેશનનો ઉપયોગ કરે છે, તેમ Patronus AI એજન્ટોને અનિશ્ચિત પરિસ્થિતિઓ સામે ખુલ્લા પાડે છે.

વર્તમાન AI એજન્ટો સાથેનો એક મોટો પ્રશ્ન એ છે કે તેઓ "શોર્ટકટ" લેવાનો પ્રયત્ન કરે છે—એવો રસ્તો શોધવો જે ટેકનિકલી સબ-ટાસ્ક પૂર્ણ કરી શકે છે પરંતુ મુખ્ય ઉદ્દેશ્યમાં નિષ્ફળ જાય છે અથવા સુરક્ષા પ્રોટોકોલનું ઉલ્લંઘન કરે છે. Patronus નું સિમ્યુલેશન વાતાવરણ ખાસ કરીને આ "હેક્સ" (hacks) ને શોધવા માટે એન્જિનિયર્ડ કરવામાં આવ્યું છે, જે ભૂલો માટે દંડ કરીને અને સાચા કામ પૂર્ણ કરવા માટે પુરસ્કાર આપીને મોડેલ્સને જવાબદાર બનાવે છે.

ઝડપી વૃદ્ધિ અને જટિલતાનું સ્કેલિંગ

આવા કડક મૂલ્યાંકન માટે બજારમાં ભારે માંગ છે. Patronus AI એ છેલ્લા એક વર્ષમાં આવકમાં 15 ગણો વધારો નોંધાવ્યો છે, જે સૂચવે છે કે ફ્રન્ટિયર AI લેબ્સ અને ઉભરતા સ્ટાર્ટઅપ્સ ઓટોમેટેડ, સ્કેલેબલ ટેસ્ટિંગ માટે આતુર છે. આ ગતિ Greenfield Partners ના નેતૃત્વમાં $50 મિલિયનના Series B ફંડિંગ રાઉન્ડમાં પરિણમી છે, જેમાં Notable Capital, Lightspeed, Datadog અને Samsung ની સહભાગીતા સાથે તેમનું કુલ ફંડિંગ $70 મિલિયન સુધી પહોંચ્યું છે.

હાલમાં, કંપની સોફ્ટવેર એન્જિનિયરિંગ અને ફાઇનાન્સ જેવા અત્યંત ચકાસી શકાય તેવા ક્ષેત્રો પર ધ્યાન કેન્દ્રિત કરી રહી છે. જોકે, ટેકનિકલ રોડમેપ મહત્વાકાંક્ષી છે. સહ-સ્થાપક આનંદ કન્નાપ્પન નોંધે છે કે ધ્યેય એવા વાતાવરણ બનાવવા છે જ્યાં એજન્ટો લાંબા સમય સુધી—10 કલાકથી 10 અઠવાડિયા સુધી—સ્વાયત્ત રીતે કામ કરી શકે, જેથી લાંબા ગાળાના તર્ક અને સુસંગતતાનું પરીક્ષણ કરી શકાય.

AI ઇકોસિસ્ટમ માટે આ શા માટે મહત્વનું છે

જ્યારે Mercor અને Surge જેવી 'હ્યુમન-ઇન-ધ-લૂપ' કંપનીઓ રિઇન્ફોર્સમેન્ટ લર્નિંગ માટે મૂલ્યવાન ડેટા પૂરો પાડે છે, ત્યારે Patronus AI સ્વાયત્ત મૂલ્યાંકનને સક્ષમ કરીને એક અનન્ય સ્થાન ધરાવે છે. ટેસ્ટિંગ લૂપમાંથી માનવીને દૂર કરીને, તેઓ સ્કેલ અને આવૃત્તિનું એવું સ્તર પ્રદાન કરે છે જે મેન્યુઅલ ટેસ્ટિંગ ક્યારેય મેળવી શકતું નથી. જેમ જેમ આપણે એજન્ટિક વર્કફ્લોના યુગ તરફ આગળ વધી રહ્યા છીએ, તેમ કડક, ઓટોમેટેડ સિમ્યુલેશન દ્વારા એજન્ટની વિશ્વસનીયતા પ્રમાણિત કરવાની ક્ષમતા ડિપ્લોયમેન્ટ માટે ગોલ્ડ સ્ટાન્ડર્ડ બની જશે.

મુખ્ય મુદ્દાઓ

  • સિમ્યુલેટેડ સ્ટ્રેસ-ટેસ્ટિંગ: Patronus AI સ્વાયત્ત એજન્ટ મૂલ્યાંકન માટે વેબસાઇટ્સ અને સિસ્ટમ્સની વાસ્તવિક નકલ બનાવવા માટે "ડિજિટલ વર્લ્ડ મોડલ્સ" નો ઉપયોગ કરે છે.
  • મોટું મૂડી રોકાણ: વાર્ષિક આવકમાં 15 ગણા વધારાને કારણે $50M ના Series B રાઉન્ડ સાથે સ્ટાર્ટઅપનું કુલ ફંડિંગ $70M થયું છે.
  • જવાબદારી પર ધ્યાન: સ્ટેટિક બેન્ચમાર્કથી વિપરીત, Patronus એવા "શોર્ટકટ્સ" અને "હેક્સ" ને ઓળખે છે જેનો ઉપયોગ એજન્ટો જટિલ તર્કને બાયપાસ કરવા માટે કરે છે, જે સાચી વિશ્વસનીયતા સુનિશ્ચિત કરે છે.