The Hard Part of AI Agents isn't Doing, It's Planning

Translated for your language. Read the original.

AI-assisted draft.

The Hard Part of AI Agents isn't Doing, It's Planning

AI Agents ਦਾ ਔਖਾ ਹਿੱਸਾ ਕੰਮ ਕਰਨਾ ਨਹੀਂ, ਸਗੋਂ ਯੋਜਨਾ ਬਣਾਉਣਾ ਹੈ

ਅਜਿਹਾ AI agent ਬਣਾਉਣਾ ਜੋ ਕੰਮ ਕਰਦਾ ਹੈ, ਆਸਾਨ ਹੈ। ਪਰ ਅਜਿਹਾ ਬਣਾਉਣਾ ਜੋ ਉਹਨਾਂ ਦੀ ਸਹੀ ਯੋਜਨਾ ਬਣਾਵੇ, ਔਖਾ ਹੈ।

ਮੈਂ ਇੱਕ CLI ਬਣਾਇਆ ਹੈ ਜਿੱਥੇ ਤੁਸੀਂ ਇੱਕ ਵਾਕ ਲਿਖਦੇ ਹੋ ਅਤੇ ਇੱਕ LLM ਤੁਹਾਡੇ ਅਸਲ ਖਾਤਿਆਂ (accounts) 'ਤੇ ਕਾਰਵਾਈਆਂ ਕਰਦਾ ਹੈ। ਮੈਂ ਦੋ ਮੋਡ ਵਰਤਦਾ ਹਾਂ: Direct mode ਅਤੇ Plan mode।

Direct mode ਰਫ਼ਤਾਰ ਲਈ ਹੈ। Plan mode ਸੁਰੱਖਿਆ ਲਈ ਹੈ। Plan mode ਵਿੱਚ, agent ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਛੂਹਣ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਨੂੰ ਹਰ ਕਦਮ ਦਿਖਾਉਂਦਾ ਹੈ।

ਇੱਥੇ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਮੈਂ ਇੱਕ ਭਰੋਸੇਮੰਦ planner ਕਿਵੇਂ ਬਣਾਇਆ:

• ਦਿਮਾਗ ਨੂੰ ਵੰਡੋ (Split the brain) ਇੱਕ agent ਯੋਜਨਾਬੰਦੀ (planning) ਅਤੇ ਅਮਲੀਕਰਨ (execution) ਦੋਵੇਂ ਨਹੀਂ ਕਰ ਸਕਦਾ। ਇੱਕ planning agent ਸੋਚਣਾ ਚਾਹੁੰਦਾ ਹੈ। ਇੱਕ execution agent ਕੰਮ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹੈ। ਮੈਂ ਉਹਨਾਂ ਨੂੰ ਦੋ ਵੱਖ-ਵੱਖ system prompts ਦੇ ਨਾਲ ਦੋ ਵੱਖ-ਵੱਖ agents ਵਿੱਚ ਵੰਡ ਦਿੱਤਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਦੂਜੇ ਨਾਲ ਲੜਨ ਤੋਂ ਰੋਕਦਾ ਹੈ।

• Agent ਨੂੰ ਅੱਖਾਂ ਦਿਓ (Give the agent eyes) ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਵਾਲਾ planner ਖ਼ਤਰਨਾਕ ਹੁੰਦਾ ਹੈ। ਮੇਰੇ ਪਹਿਲੇ ਵਰਜ਼ਨ ਨੇ ਅੰਦਾਜ਼ਿਆਂ ਦੇ ਅਧਾਰ 'ਤੇ ਯੋਜਨਾਵਾਂ ਬਣਾਈਆਂ ਸਨ। ਹੁਣ, planner ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਖੋਜ ਕਰਨ ਲਈ read-only tools ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ ਵੀ ਕਦਮ ਲਿਖਣ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਅਸਲ Salesforce fields ਨੂੰ ਦੇਖਦਾ ਹੈ।

• ਜਵਾਬ ਪਹਿਲਾਂ ਹੀ ਭਰ ਦਿਓ (Prefill the answers) Agents ਅਕਸਰ ਗਲਤ ਸਵਾਲ ਪੁੱਛਦੇ ਹਨ। ਜੇਕਰ ਉਹ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸਵਾਲ ਪੁੱਛਦੇ ਹਨ, ਤਾਂ ਅੰਤ ਵਿੱਚ ਤੁਹਾਨੂੰ ਉਹਨਾਂ ਲਈ ਕੰਮ ਕਰਨਾ ਪੈਂਦਾ ਹੈ। ਮੈਂ ਇਸ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ। Planner ਅਜੇ ਵੀ ਸਵਾਲ ਪੁੱਛਦਾ ਹੈ, ਪਰ ਇਹ ਇੱਕ ਸਿਫ਼ਾਰਸ਼ੀ ਜਵਾਬ (recommended answer) ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਬੱਸ ਉਸ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨੀ ਹੁੰਦੀ ਹੈ ਜਾਂ ਥੋੜ੍ਹਾ ਬਦਲਣਾ ਹੁੰਦਾ ਹੈ। ਇਹ ਮੈਨੂਅਲ ਡੇਟਾ ਐਂਟਰੀ ਤੋਂ ਬਿਨਾਂ ਯੋਜਨਾ ਨੂੰ ਸਹੀ ਰੱਖਦਾ ਹੈ।

• ਸਿਰਫ਼ ਸੂਚੀ ਨਹੀਂ, ਸਗੋਂ ਸੰਦਰਭ (context) ਵੀ ਭੇਜੋ ਜੇਕਰ ਤੁਸੀਂ executor ਨੂੰ ਸਿਰਫ਼ ਕਦਮਾਂ ਦੀ ਇੱਕ ਸੂਚੀ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਉਹ ਤਰਕ (reasoning) ਗੁਆ ਲੈਂਦਾ ਹੈ। ਮੈਂ planner ਨੂੰ ਕਦਮਾਂ ਦੇ ਨਾਲ-ਨਾਲ ਅੰਦਾਜ਼ੇ ਅਤੇ ਜੋਖਮਾਂ ਨੂੰ ਵੀ ਭੇਜਣ ਲਈ ਕਿਹਾ। ਹੁਣ executor ਨੂੰ ਹਰ ਕਾਰਵਾਈ ਦੇ ਪਿੱਛੇ ਦਾ "ਕਿਉਂ" ਪਤਾ ਹੁੰਦਾ ਹੈ।

• ਖ਼ਤਰੇ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰੋ (Label the danger) ਯੋਜਨਾ ਉਦੋਂ ਹੀ ਸੁਰੱਖਿਅਤ ਹੁੰਦੀ ਹੈ ਜੇਕਰ ਤੁਸੀਂ ਜੋਖਮਾਂ ਨੂੰ ਦੇਖ ਸਕਦੇ ਹੋ। ਮੇਰਾ ਸਿਸਟਮ ਡਿਲੀਟ ਕਰਨ ਜਾਂ ਰੀਨੇਮ (rename) ਕਰਨ ਵਰਗੀਆਂ ਵਿਨਾਸ਼ਕਾਰੀ ਕਾਰਵਾਈਆਂ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰਦਾ ਹੈ। ਜਦੋਂ agent ਕਿਸੇ ਵਿਨਾਸ਼ਕਾਰੀ ਕਦਮ 'ਤੇ ਪਹੁੰਚਦਾ ਹੈ, ਤਾਂ ਇਹ ਰੁਕ ਜਾਂਦਾ ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਪੁੱਛਦਾ ਹੈ।

• ਡੇਟਾ ਨੂੰ ਫੈਸਲਾਕੁਨ (tiebreaker) ਵਜੋਂ ਵਰਤੋ ਜੇਕਰ ਇੱਕ agent ਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਕੋਈ ਕਦਮ ਅਸਫਲ ਰਿਹਾ ਹੈ ਅਤੇ ਤੁਸੀਂ ਉਸਨੂੰ ਦੁਬਾਰਾ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਕਹਿੰਦੇ ਹੋ, ਤਾਂ ਉਹ ਸਿਰਫ਼ ਅੰਨ੍ਹੇਵਾਹ ਅੱਗੋਂ ਨਹੀਂ ਮੰਨਦਾ। ਇਹ ਅਸਲ ਪਲੇਟਫਾਰਮ ਡੇਟਾ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਡੇਟਾ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਕੰਮ ਪਹਿਲਾਂ ਹੀ ਹੋ ਚੁੱਕਾ ਹੈ, ਤਾਂ agent ਤੁਹਾਡੇ ਦਾਅਵੇ ਨਾਲੋਂ ਡੇਟਾ 'ਤੇ ਭਰੋਸਾ ਕਰਦਾ ਹੈ।

ਸੁਰੱਖਿਆ ਬਾਰੇ ਸੱਚਾਈ: Plan mode prompt injection ਜਾਂ ਅਜਿਹੇ ਉਪਭੋਗਤਾ ਨੂੰ ਨਹੀਂ ਰੋਕਦਾ ਜੋ ਬਿਨਾਂ ਦੇਖੇ "approve" 'ਤੇ ਕਲਿੱਕ ਕਰ ਦਿੰਦਾ ਹੈ। ਇਹ ਜ਼ਿੰਮੇਵਾਰੀ "ਮਾਡਲ 'ਤੇ ਭਰੋਸਾ ਕਰਨ" ਤੋਂ ਹਟਾ ਕੇ "ਜਾਂਚ ਕਰਨ ਲਈ ਇਨਸਾਨ 'ਤੇ ਭਰੋਸਾ ਕਰਨ" ਵੱਲ ਲੈ ਜਾਂਦਾ ਹੈ।

ਢਾਂਚਾ ਗਾਰਡਰੇਲ (guardrails) ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਪਰ ਤੁਹਾਡੀ ਸਮੀਖਿਆ ਅੰਤਮ ਸੁਰੱਖਿਆ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।

Source: https://dev.to/abdullahsaad5/the-hard-part-of-my-ai-agent-wasnt-doing-the-work-it-was-planning-it-n0k

Optional learning community: https://t.me/GyaanSetuAi

The Hard Part of AI Agents isn't Doing, It's Planning

Continue reading

Testing Agentic AI Systems

Creating Specialized AI Agents

Enterprise AI Agents Need a Control Plane

ਆਪਣੇ ਏਜੰਟਾਂ ਨੂੰ ਪ੍ਰੋਂਪਟ ਕਰਨਾ ਬੰਦ ਕਰੋ। ਉਹਨਾਂ ਦੀ ਅਗਵਾਈ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰੋ।

Inside An AI Agent