ఏజెంట్ స్ట్రెస్-టెస్టింగ్ కోసం డిజిటల్ ప్రపంచాలను నిర్మించడానికి Patronus AI $50M ని సేకరించింది

AI ఏజెంట్లు సాధారణ చాట్ ఇంటర్‌ఫేస్‌ల నుండి సంక్లిష్టమైన, బహుళ-దశల పనులను నిర్వహించగల స్వయంప్రతిపత్తి కలిగిన (autonomous) సంస్థలుగా మారుతున్న కొద్దీ, పరిశ్రమ ఒక కీలకమైన అడ్డంకిని ఎదుర్కొంటోంది: అదే విశ్వసనీయత (reliability). Patronus AI ఈ సవాలును ఎదుర్కోవడానికి, ఈ ఏజెంట్లు నిజ ప్రపంచంలోకి ప్రవేశించే ముందే వాటిని స్ట్రెస్-టెస్ట్ చేయడానికి రూపొందించిన అధునాతన సిమ్యులేటెడ్ వాతావరణాలను (simulated environments) నిర్మిస్తోంది.

స్టాటిక్ బెంచ్‌మార్క్‌ల నుండి ముందుకు

ఏళ్ల తరబడి, AI ల్యాబ్‌లు మోడల్ సామర్థ్యాన్ని నిరూపించుకోవడానికి ప్రామాణిక బెంచ్‌మార్క్‌లపై ఆధారపడుతున్నాయి. అయితే, ఈ స్టాటిక్ పరీక్షల్లో వచ్చే అధిక స్కోర్లు తరచుగా నిజ ప్రపంచ నైపుణ్యానికి నిదర్శనంగా నిలవలేవు. ఒక ఏజెంట్ రాత పరీక్షలో ఉత్తీర్ణత సాధించవచ్చు, కానీ ఒక లైవ్ వెబ్‌సైట్‌ను నావిగేట్ చేయాలన్నా లేదా సంక్లిష్టమైన ఆర్థిక వర్క్‌ఫ్లోను నిర్వహించాలన్నా విఫలమవ్వచ్చు.

మాజీ Meta AI పరిశోధకులు ఆనంద్ కన్నప్పన్ మరియు రెబెక్కా క్వాన్ 2023లో స్థాపించిన Patronus AI, ప్రస్తుతం కొత్త ప్రమాణాలను నెలకొల్పుతోంది. స్టాటిక్ ప్రశ్నలకు బదులుగా, ఈ స్టార్టప్ వెబ్‌సైట్‌లు మరియు అంతర్గత ఎంటర్‌ప్రైజ్ సిస్టమ్‌ల యొక్క అత్యంత ఖచ్చితమైన నకళ్లను (high-fidelity replicas) సృష్టించడానికి "డిజిటల్ వరల్డ్ మోడల్స్"ను ఉపయోగిస్తుంది. ఈ వాతావరణాలు ఏజెంట్లు నిజ ప్రపంచంలోని అనిశ్చితిని పోలి ఉండే సాండ్‌బాక్స్‌లో పనిచేయడానికి అనుమతిస్తాయి, తద్వారా నిజ ప్రపంచానికి నష్టం కలిగించకుండానే అవి క్లిష్టమైన పరిస్థితులను (edge cases) ఎదుర్కోగలవని నిర్ధారిస్తాయి.

AI ఏజెంట్ల కోసం "Waymo విధానం"

Patronus AI వెనుక ఉన్న ప్రధాన ఆవిష్కరణ ఈ కృత్రిమ డిజిటల్ ప్రపంచాలలో రీఇన్‌ఫోర్స్‌మెంట్ లెర్నింగ్‌ను (reinforcement learning) ఉపయోగించడంలో ఉంది. కంపెనీ Waymo స్వయంప్రతిపత్తి కలిగిన వాహనాలను ఎలా శిక్షణ ఇస్తుందో దానికి నేరుగా పోలికను చూపుతుంది: Waymo కఠినమైన వాతావరణం లేదా అకస్మాత్తుగా పాదచారుల కదలికల వంటి అరుదైన ప్రమాదాలను స్వయంచాలక కార్లకు పరిచయం చేయడానికి సిమ్యులేషన్‌లను ఉపయోగించినట్లే, Patronus AI ఏజెంట్లను ఊహించని పరిస్థితులకు గురి చేస్తుంది.

ప్రస్తుత AI ఏజెంట్లలో ఒక ముఖ్యమైన సమస్య ఏమిటంటే, అవి "షార్ట్‌కట్‌లు" (shortcuts) తీసుకోవడం—అంటే సాంకేతికంగా ఒక ఉప-పనిని (sub-task) పూర్తి చేసే, కానీ ప్రధాన లక్ష్యాన్ని విఫలం చేసే లేదా భద్రతా ప్రోటోకాల్‌లను ఉల్లంఘించే సులభమైన మార్గాన్ని వెతకడం. Patronus యొక్క సిమ్యులేషన్ వాతావరణం ప్రత్యేకంగా ఈ "హ్యాక్‌లను" గుర్తించేలా రూపొందించబడింది, తప్పులకు శిక్ష వేయడం మరియు అసలైన పని పూర్తి చేసినప్పుడు బహుమతి ఇవ్వడం ద్వారా మోడళ్లను బాధ్యతాయుతంగా ఉంచుతుంది.

వేగవంతమైన వృద్ధి మరియు సంక్లిష్టతను పెంచడం

ఇటువంటి కఠినమైన మూల్యాంకనం కోసం మార్కెట్ డిమాండ్ భారీగా ఉంది. Patronus AI గత ఏడాదిలో 15 రెట్లు రాబడి వృద్ధిని నమోదు చేసింది, ఇది ఫ్రాంటియర్ AI ల్యాబ్‌లు మరియు అభివృద్ధి చెందుతున్న స్టార్టప్‌లు ఆటోమేటెడ్, స్కేలబుల్ టెస్టింగ్ కోసం ఎంతగానో ఎదురుచూస్తున్నాయని సూచిస్తోంది. ఈ వేగం వల్ల Greenfield Partners నేతృత్వంలో $50 మిలియన్ల Series B నిధులను సేకరించింది, ఇందులో Notable Capital, Lightspeed, Datadog మరియు Samsung కూడా పాల్గొన్నారు, దీనితో వారి మొత్తం నిధులు $70 మిలియన్లకు చేరుకున్నాయి.

ప్రస్తుతం, కంపెనీ సాఫ్ట్‌వేర్ ఇంజనీరింగ్ మరియు ఫైనాన్స్ వంటి అత్యంత ధృవీకరించదగిన (verifiable) రంగాలపై దృష్టి సారించింది. అయితే, సాంకేతిక రోడ్‌మ్యాప్ చాలా ప్రతిష్టాత్మకంగా ఉంది. ఏజెంట్లు సుదీర్ఘ కాలం పాటు—10 గంటల నుండి 10 వారాల వరకు—స్వయంప్రతిపత్తితో పనిచేసే వాతావరణాలను నిర్మించడం ద్వారా వాటి దీర్ఘకాలిక తర్కాన్ని (reasoning) మరియు స్థిరత్వాన్ని పరీక్షించడమే లక్ష్యమని సహ-వ్యవస్థాపకుడు ఆనంద్ కన్నప్పన్ పేర్కొన్నారు.

AI ఎకోసిస్టమ్ కోసం ఇది ఎందుకు ముఖ్యం

Mercor మరియు Surge వంటి 'హ్యూమన్-ఇన్-ది-లూప్' (human-in-the-loop) సంస్థలు రీఇన్‌ఫోర్స్‌మెంట్ లెర్నింగ్ కోసం విలువైన డేటాను అందించినప్పటికీ, Patronus AI స్వయంప్రతిపత్తి కలిగిన మూల్యాంకనాన్ని (autonomous evaluation) సాధ్యం చేయడం ద్వారా ఒక ప్రత్యేక స్థానాన్ని సంపాదించుకుంది. టెస్టింగ్ ప్రక్రియ నుండి మనుషులను తొలగించడం ద్వారా, వారు మాన్యువల్ టెస్టింగ్‌తో సాధ్యం కాని స్థాయి స్కేల్ మరియు ఫ్రీక్వెన్సీని అందిస్తారు. మనం ఏజెంటిక్ వర్క్‌ఫ్లోల (agentic workflows) యుగం వైపు వెళ్తున్న కొద్దీ, కఠినమైన, ఆటోమేటెడ్ సిమ్యులేషన్ ద్వారా ఏజెంట్ యొక్క విశ్వసనీయతను ధృవీకరించే సామర్థ్యం డిప్లాయ్‌మెంట్‌కు గోల్డ్ స్టాండర్డ్‌గా మారుతుంది.

ముఖ్య అంశాలు

  • సిమ్యులేటెడ్ స్ట్రెస్-టెస్టింగ్: స్వయంప్రతిపత్తి కలిగిన ఏజెంట్ మూల్యాంకనం కోసం వెబ్‌సైట్‌లు మరియు సిస్టమ్‌ల యొక్క వాస్తవిక నకళ్లను సృష్టించడానికి Patronus AI "డిజిటల్ వరల్డ్ మోడల్స్"ను ఉపయోగిస్తుంది.
  • భారీ మూలధన సంచయం: వార్షిక రాబడి 15 రెట్లు పెరగడంతో, $50M Series B రౌండ్ ద్వారా స్టార్టప్ యొక్క మొత్తం నిధులు $70M కి చేరుకున్నాయి.
  • బాధ్యతాయుతమైన పనితీరుపై దృష్టి: స్టాటిక్ బెంచ్‌మార్క్‌ల వలె కాకుండా, ఏజెంట్లు సంక్లిష్టమైన తర్కాన్ని దాటవేయడానికి ఉపయోగించే "షార్ట్‌కట్‌లు" మరియు "హ్యాక్‌లను" Patronus గుర్తిస్తుంది, తద్వారా నిజమైన విశ్వసనీయతను నిర్ధారిస్తుంది.