ఏజెంట్ల కొత్త శకాన్ని శక్తివంతం చేయడానికి Google, Geminiని Interactions APIకి మారుస్తోంది

Google DeepMind అధికారికంగా Interactions APIని అన్ని Gemini మోడల్స్ మరియు ఏజెంట్ల కోసం డిఫాల్ట్ ఇంటర్‌ఫేస్‌గా ప్రకటించింది, ఇది డెవలపర్లు Google AIతో ఎలా నిర్మిస్తారనే దానిలో ఒక ప్రాథమిక మార్పును సూచిస్తుంది. పాత generateContent ఇంటర్‌ఫేస్‌ను భర్తీ చేయడం ద్వారా, Google కేవలం టెక్స్ట్-ఇన్/టెక్స్ట్-అవుట్ ఇంటరాక్షన్ల నుండి స్వయంప్రతిపత్తి కలిగిన ఏజెన్సీ (autonomous agency) కోసం ప్రత్యేకంగా రూపొందించబడిన సంక్లిష్టమైన, బహుళ-దశల ఫ్రేమ్‌వర్క్ వైపు మళ్లుతోంది.

సాధారణ చాటింగ్‌ నుండి స్వయంప్రతిపత్తి కలిగిన ఏజెంట్ల వైపు

జనరేటివ్ AI యుగంలో ఎక్కువ కాలం, డెవలపర్లు generateContent మెథడ్‌పై ఆధారపడ్డారు, ఇది స్టేట్‌లెస్ (stateless), సింగిల్-టర్న్ స్పందనల కోసం ఆప్టిమైజ్ చేయబడింది. Interactions APIకి మారడం అనేది "Agentic AI" పట్ల Google యొక్క నిబద్ధతను సూచిస్తుంది—అంటే కేవలం మాట్లాడటమే కాకుండా, పనులు చేసే వ్యవస్థలు.

Google డెవలపర్ రిలేషన్స్ లీడ్ లోగన్ కిల్‌ప్యాట్రిక్ ప్రకారం, ఈ API "ఏజెంట్ల కొత్త శకాానికి పునాది వేస్తుంది." ఈ మార్పు వల్ల గతంలో అమలు చేయడం కష్టమైన ఫీచర్లు సాధ్యమవుతాయి, ఉదాహరణకు స్వంత Linux sandboxes కలిగిన Managed Agents. ఇది మోడల్స్ సురక్షితమైన, వేరు చేయబడిన వాతావరణంలో కోడ్‌ను అమలు చేయడానికి అనుమతిస్తుంది, తద్వారా అవి కేవలం తదుపరి టోకెన్‌ను అంచనా వేయడమే కాకుండా సంక్లిష్టమైన కంప్యూటేషనల్ పనులను కూడా చేయగలవు.

అధునాతన సామర్థ్యాలు: Tool Chaining మరియు Background Execution

Interactions API Geminiని చాట్‌బాట్ నుండి ఒక ఫంక్షనల్ అసిస్టెంట్‌గా మార్చే అనేక ఉన్నత స్థాయి సామర్థ్యాలను పరిచయం చేస్తోంది. కీలక సాంకేతిక మెరుగుదలలు ఇక్కడ ఉన్నాయి:

  • Tool Chaining: Google Search మరియు Google Mapsతో సులభమైన అనుసంధానం వల్ల ఏజెంట్లు తమ చర్యలను వాస్తవ ప్రపంచ డేటా ఆధారంగా చేయగలుగుతాయి.
  • Long-running Tasks: ఈ API బ్యాక్‌గ్రౌండ్ ఎగ్జిక్యూషన్‌ను సపోర్ట్ చేస్తుంది, దీనివల్ల క్లయింట్ నుండి నిరంతర, యాక్టివ్ కనెక్షన్ అవసరం లేకుండానే ఏజెంట్లు సంక్లిష్టమైన వర్క్‌ఫ్లోలపై పనిచేయగలవు.
  • Multimodal Generation: డెవలపర్లు ఇప్పుడు ఏజెంటిక్ వర్క్‌ఫ్లో ద్వారా నేరుగా ఇమేజెస్, మ్యూజిక్ మరియు స్పీచ్ జనరేషన్‌ను నిర్వహించవచ్చు.
  • State Management: ఈ API బహుళ-దశల రీజనింగ్ సంక్లిష్టతను నిర్వహిస్తుంది, దీనివల్ల ఏజెంట్లు వివిధ టూల్స్ వాడకం మరియు ఎక్స్‌టర్నల్ కాల్స్ మధ్య కాంటెక్స్ట్‌ను కొనసాగించగలవు.

సరళీకృత స్కీమా మరియు ఆప్టిమైజ్ చేయబడిన ఎగ్జిక్యూషన్ మోడ్స్

డెవలపర్లకు మరింత సులభంగా అర్థమయ్యేలా Google ఈ API యొక్క సాంకేతిక నిర్మాణాన్ని కూడా క్రమబద్ధీకరించింది. సాంప్రదాయ రోల్-ఆధారిత నిర్మాణం ("user" మరియు "model" వంటి లేబుల్స్‌ను ఉపయోగించడం) స్థానంలో టైప్ చేయబడిన "steps" వ్యవస్థ వచ్చింది. ఈ కొత్త స్కీమాలో, యూజర్ ప్రాంప్ట్ నుండి ఫంక్షన్ కాల్ మరియు తదుపరి టూల్ రెస్పాన్స్ వరకు ప్రతి విడి చర్యను ఒక క్రమ పద్ధతిలోని నిర్వచించబడిన స్టెప్‌గా పరిగణిస్తారు.

వివిధ అప్లికేషన్‌ల ఆర్థిక మరియు పనితీరు అవసరాలను తీర్చడానికి, Google రెండు విభిన్న ఎగ్జిక్యూషన్ మోడ్‌లను పరిచయం చేసింది:

  • Flex Mode: ఖర్చు సామర్థ్యం కోసం ఆప్టిమైజ్ చేయబడింది, ఇది భారీ స్థాయి లేదా అత్యవసరం కాని పనులను నిర్వహించే డెవలపర్ల కోసం ఖర్చులను 50 శాతం తగ్గిస్తుంది.
  • Priority Mode: తక్కువ లాటెన్సీ (low latency) కోసం ఆప్టిమైజ్ చేయబడింది, ఇది వేగం అవసరమైన అప్లికేషన్‌లకు సాధ్యమైనంత వేగవంతమైన ఇన్ఫరెన్స్‌ను అందిస్తుంది.

AI ఎకోసిస్టమ్ కోసం ఇది ఎందుకు ముఖ్యం

ఈ చర్య పరిశ్రమ "చాట్‌బాట్" దశ నుండి "ఏజెంట్" దశకు మారుతోందని సూచిస్తుంది. టూల్ వాడకం, సాండ్‌బాక్స్‌డ్ ఎగ్జిక్యూషన్ మరియు లాంగ్-రన్నింగ్ ప్రాసెస్ల కోసం రూపొందించబడిన APIని ప్రామాణీకరించడం ద్వారా, వెబ్‌ను నావిగేట్ చేయగల, ఫైళ్లను నిర్వహించగల మరియు కోడ్‌ను అమలు చేయగల స్వయంప్రతిపత్తి కలిగిన సాఫ్ట్‌వేర్‌కు అవసరమైన మౌలిక సదుపాయాలను Google అందిస్తోంది. డెవలపర్లకు, దీని అర్థం స్టేట్‌ను నిర్వహించడానికి తక్కువ సమయం మరియు సంక్లిష్టమైన, నమ్మదగిన AI వర్క్‌ఫ్లోలను నిర్మించడానికి ఎక్కువ సమయం దొరుకుతుంది.

ముఖ్య అంశాలు

  • API ట్రాన్సిషన్: Gemini కోసం డిఫాల్ట్‌గా generateContent స్థానంలో Interactions API వస్తుంది, ఇది Linux sandboxing మరియు tool chaining వంటి అధునాతన ఏజెంటిక్ ఫీచర్లను సాధ్యం చేస్తుంది.
  • కొత్త ఎగ్జిక్యూషన్ మోడ్స్: డెవలపర్లు ఇప్పుడు Flex mode (50% ఖర్చు ఆదా) మరియు Priority mode (వేగం కోసం ఆప్టిమైజ్ చేయబడింది) మధ్య ఎంచుకోవచ్చు.
  • నిర్మాణాత్మక మార్పు: ఈ API "user/model" రోల్ స్ట్రక్చర్ నుండి "typed steps" స్కీమాకు మారుతుంది, ఇది స్వయంప్రతిపత్తి కలిగిన ఏజెంట్ల బహుళ-దశల స్వభావాన్ని మెరుగ్గా ప్రతిబింబిస్తుంది.