Beyond Sandboxes: Building Durable AI Agents

Translated for your language. Read the original.

AI-assisted draft.

Beyond Sandboxes: Building Durable AI Agents

ਸੈਂਡਬਾਕਸ ਤੋਂ ਪਰੇ: ਟਿਕਾਊ AI Agents ਬਣਾਉਣਾ

ਪ੍ਰੋਡਕਸ਼ਨ AI agents ਲਈ ਸੈਂਡਬਾਕਸ ਕਾਫ਼ੀ ਨਹੀਂ ਹਨ।

ਜ਼ਿਆਦਾਤਰ ਡਿਵੈਲਪਰ agents ਨੂੰ ਮੈਮੋਰੀ ਵਿੱਚ ਇੱਕ ਸਧਾਰਨ ਲੂਪ ਵਜੋਂ ਬਣਾਉਂਦੇ ਹਨ। LLM ਦੇਖਦਾ ਹੈ, ਫੈਸਲਾ ਲੈਂਦਾ ਹੈ, ਕੰਮ ਕਰਦਾ ਹੈ, ਅਤੇ ਦੁਹਰਾਉਂਦਾ ਹੈ। ਇਹ ਲੈਬ ਵਿੱਚ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਹ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਫੇਲ੍ਹ ਹੋ ਜਾਂਦਾ ਹੈ।

ਮੈਮੋਰੀ ਲੂਪ ਕਿਉਂ ਫੇਲ੍ਹ ਹੁੰਦਾ ਹੈ?

ਲੰਬੇ ਕੰਮ: ਜੇਕਰ ਕਿਸੇ agent ਨੂੰ ਖਤਮ ਹੋਣ ਲਈ ਦਿਨਾਂ ਦੀ ਲੋੜ ਹੈ ਜਾਂ ਕਿਸੇ ਕੰਮ ਨੂੰ ਮਨਜ਼ੂਰੀ ਦੇਣ ਲਈ ਇਨਸਾਨ ਦਾ ਇੰਤਜ਼ਾਰ ਕਰਨਾ ਪੈਂਦਾ ਹੈ, ਤਾਂ ਇੱਕ ਪ੍ਰੋਸੈਸ ਨੂੰ ਚੱਲਦਾ ਰੱਖਣ ਨਾਲ CPU ਅਤੇ ਮੈਮੋਰੀ ਬਰਬਾਦ ਹੁੰਦੀ ਹੈ।
ਕ੍ਰੈਸ਼ ਰਿਕਵਰੀ ਦੀ ਘਾਟ: ਜੇਕਰ ਸਿਸਟਮ ਕ੍ਰੈਸ਼ ਹੋ ਜਾਂਦਾ ਹੈ ਜਾਂ ਨੈੱਟਵਰਕ ਡਿਸਕਨੈਕਟ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਸਾਰੀ ਸਟੇਟ (state) ਗੁਆ ਲੈਂਦੇ ਹੋ। ਤੁਸੀਂ ਉੱਥੋਂ ਦੁਬਾਰਾ ਸ਼ੁਰੂ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜਿੱਥੋਂ ਤੁਸੀਂ ਛੱਡਿਆ ਸੀ।
ਜਟਿਲਤਾ: ਬਹੁਤ ਸਾਰੇ ਵਾਧੂ ਕੋਡ ਤੋਂ ਬਿਨਾਂ ਕਈ agents ਲਈ ਇੱਕ ਦੂਜੇ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੁੰਦਾ ਹੈ।

Orkes ਦੇ CTO, Virein Baraiya, ਇੱਕ ਬਿਹਤਰ ਤਰੀਕਾ ਸੁਝਾਉਂਦੇ ਹਨ। ਆਪਣੇ ਕੰਮਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਕਰੋ (Separate your concerns)।

ਸਿਰਫ਼ ਐਕਸ਼ਨਾਂ ਲਈ ਸੈਂਡਬਾਕਸ ਦੀ ਵਰਤੋਂ ਕਰੋ। ਜੋਖਮ ਭਰੇ tool code ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੂਪ ਵਿੱਚ ਚਲਾਉਣ ਲਈ ਸੈਂਡਬਾਕਸ ਦੀ ਵਰਤੋਂ ਕਰੋ।

ਤਰਕ (reasoning) ਲਈ ਇੱਕ ਟਿਕਾਊ runtime ਦੀ ਵਰਤੋਂ ਕਰੋ। LLM ਯੋਜਨਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। Runtime ਸਿਸਟਮ ਕਾਰਜਪ੍ਰਣਾਲੀ (execution) ਅਤੇ ਸਟੇਟ (state) ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ।

ਉਹ ਇਸ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਦੋ ਟੂਲ ਪੇਸ਼ ਕਰਦੇ ਹਨ:

Netflix Conductor ਇਹ ਇੱਕ workflow engine ਹੈ। ਇਹ ਇੱਕ ਲੈਜਰ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਹ ਡਾਟਾਬੇਸ ਵਿੱਚ ਹਰ LLM call ਅਤੇ ਹਰ tool ਦੀ ਵਰਤੋਂ ਨੂੰ ਰਿਕਾਰਡ ਕਰਦਾ ਹੈ।

ਇਹ on-demand suspension ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਕੋਈ agent ਇਨਸਾਨ ਦੀ ਉਡੀਕ ਕਰਦਾ ਹੈ, ਤਾਂ ਸਿਸਟਮ workflow ਨੂੰ ਰੋਕ ਦਿੰਦਾ ਹੈ ਅਤੇ ਸਾਰੀ ਮੈਮੋਰੀ ਖਾਲੀ ਕਰ ਦਿੰਦਾ ਹੈ।
ਇਹ ਕੰਮ ਨੂੰ ਖਤਮ ਕਰਨ ਲਈ ਮਹੀਨਿਆਂ ਬਾਅਦ ਵੀ ਜਾਗ ਸਕਦਾ ਹੈ।

Agent Span ਇਹ Conductor ਦੇ ਉੱਪਰ ਬਣਾਇਆ ਗਿਆ ਇੱਕ runtime ਹੈ। ਇਹ ਇੱਕ ਅਨੁਵਾਦਕ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ।

ਤੁਸੀਂ LangGraph ਜਾਂ OpenAI SDK ਵਰਗੇ ਮੌਜੂਦਾ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ।
Agent Span ਤੁਹਾਡੇ ਬਿਜ਼ਨਸ ਲੌਜਿਕ ਨੂੰ ਦੁਬਾਰਾ ਲਿਖੇ ਬਿਨਾਂ ਤੁਹਾਡੇ agent ਕੋਡ ਨੂੰ ਟਿਕਾਊ workflows ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ।

ਇਹ ਆਰਕੀਟੈਕਚਰ ਤਿੰਨ ਵੱਡੀਆਂ ਜਿੱਤਾਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ:

Guardrails: ਫਰੇਮਵਰਕ ਨਿਯਮਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰਦਾ ਹੈ, LLM ਨੂੰ ਨਹੀਂ। ਇਹ hallucinations ਨੂੰ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਣ ਤੋਂ ਰੋਕਦਾ ਹੈ।
ਪੂਰਾ Audit: ਤੁਸੀਂ ਮਹੀਨਿਆਂ ਬਾਅਦ ਵੀ ਦੇਖ ਸਕਦੇ ਹੋ ਕਿ ਇੱਕ agent ਨੇ ਫੈਸਲਾ ਕਿਉਂ ਲਿਆ ਸੀ। ਤੁਸੀਂ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਬਾਰਾ ਚਲਾ (replay) ਵੀ ਸਕਦੇ ਹੋ।
ਬਿਹਤਰ Testing: ਤੁਸੀਂ ਇੱਕ LLM output ਨੂੰ ਬਦਲ ਸਕਦੇ ਹੋ ਅਤੇ ਦੇਖ ਸਕਦੇ ਹੋ ਕਿ ਬਾਕੀ ਸਿਸਟਮ ਕਿਵੇਂ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰਦਾ ਹੈ।

ਬਣਾਉਣ ਵਾਲਿਆਂ ਲਈ ਇੱਕ ਆਖਰੀ ਟਿਪ: ਬਿਜ਼ਨਸ ਸੰਦਰਭ (business context) 'ਤੇ ਧਿਆਨ ਦਿਓ। ਮਾਡਲ ਬਦਲਦੇ ਹਨ। ਫਰੇਮਵਰਕ ਬਦਲਦੇ ਹਨ। ਪਰ ਤੁਹਾਡਾ ਬਿਜ਼ਨਸ ਜਿਸ ਖਾਸ ਤਰੀਕੇ ਨਾਲ ਕੰਮਾਂ ਨੂੰ ਲਾਗੂ ਕਰਦਾ ਹੈ, ਉਹ ਤੁਹਾਡੀ ਅਸਲ ਤਾਕਤ ਹੈ।

Source: https://dev.to/cognitalk/chao-yue-sha-xiang-wei-ai-agent-gou-jian-chi-jiu-hua-yun-xing-shi-2i9i

Optional learning community: https://t.me/GyaanSetuAi

Beyond Sandboxes: Building Durable AI Agents

ਸੈਂਡਬਾਕਸ ਤੋਂ ਪਰੇ: ਟਿਕਾਊ AI Agents ਬਣਾਉਣਾ

Continue reading

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ AI ਏਜੰਟਾਂ ਨੂੰ ਚਲਾਉਣ ਵੇਲੇ ਮੈਂ ਕੀ ਸਿੱਖਿਆ

The Exact Stack I Use to Build Production AI Agents

ਪ੍ਰੋਡਕਸ਼ਨ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ AI ਏਜੰਟ ਪਲੇਗਰਾਊਂਡ ਤਿਆਰ ਕਰਨਾ

Inside An AI Agent