AI Agents ਦਾ ਔਖਾ ਹਿੱਸਾ ਕੰਮ ਕਰਨਾ ਨਹੀਂ, ਸਗੋਂ ਯੋਜਨਾ ਬਣਾਉਣਾ ਹੈ
ਅਜਿਹਾ AI agent ਬਣਾਉਣਾ ਜੋ ਕੰਮ ਕਰਦਾ ਹੈ, ਆਸਾਨ ਹੈ। ਪਰ ਅਜਿਹਾ ਬਣਾਉਣਾ ਜੋ ਉਹਨਾਂ ਦੀ ਸਹੀ ਯੋਜਨਾ ਬਣਾਵੇ, ਔਖਾ ਹੈ।
ਮੈਂ ਇੱਕ CLI ਬਣਾਇਆ ਹੈ ਜਿੱਥੇ ਤੁਸੀਂ ਇੱਕ ਵਾਕ ਲਿਖਦੇ ਹੋ ਅਤੇ ਇੱਕ LLM ਤੁਹਾਡੇ ਅਸਲ ਖਾਤਿਆਂ (accounts) 'ਤੇ ਕਾਰਵਾਈਆਂ ਕਰਦਾ ਹੈ। ਮੈਂ ਦੋ ਮੋਡ ਵਰਤਦਾ ਹਾਂ: Direct mode ਅਤੇ Plan mode।
Direct mode ਰਫ਼ਤਾਰ ਲਈ ਹੈ। Plan mode ਸੁਰੱਖਿਆ ਲਈ ਹੈ। Plan mode ਵਿੱਚ, agent ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਛੂਹਣ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਨੂੰ ਹਰ ਕਦਮ ਦਿਖਾਉਂਦਾ ਹੈ।
ਇੱਥੇ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਮੈਂ ਇੱਕ ਭਰੋਸੇਮੰਦ planner ਕਿਵੇਂ ਬਣਾਇਆ:
• ਦਿਮਾਗ ਨੂੰ ਵੰਡੋ (Split the brain) ਇੱਕ agent ਯੋਜਨਾਬੰਦੀ (planning) ਅਤੇ ਅਮਲੀਕਰਨ (execution) ਦੋਵੇਂ ਨਹੀਂ ਕਰ ਸਕਦਾ। ਇੱਕ planning agent ਸੋਚਣਾ ਚਾਹੁੰਦਾ ਹੈ। ਇੱਕ execution agent ਕੰਮ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹੈ। ਮੈਂ ਉਹਨਾਂ ਨੂੰ ਦੋ ਵੱਖ-ਵੱਖ system prompts ਦੇ ਨਾਲ ਦੋ ਵੱਖ-ਵੱਖ agents ਵਿੱਚ ਵੰਡ ਦਿੱਤਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਦੂਜੇ ਨਾਲ ਲੜਨ ਤੋਂ ਰੋਕਦਾ ਹੈ।
• Agent ਨੂੰ ਅੱਖਾਂ ਦਿਓ (Give the agent eyes) ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਵਾਲਾ planner ਖ਼ਤਰਨਾਕ ਹੁੰਦਾ ਹੈ। ਮੇਰੇ ਪਹਿਲੇ ਵਰਜ਼ਨ ਨੇ ਅੰਦਾਜ਼ਿਆਂ ਦੇ ਅਧਾਰ 'ਤੇ ਯੋਜਨਾਵਾਂ ਬਣਾਈਆਂ ਸਨ। ਹੁਣ, planner ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਖੋਜ ਕਰਨ ਲਈ read-only tools ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ ਵੀ ਕਦਮ ਲਿਖਣ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਅਸਲ Salesforce fields ਨੂੰ ਦੇਖਦਾ ਹੈ।
• ਜਵਾਬ ਪਹਿਲਾਂ ਹੀ ਭਰ ਦਿਓ (Prefill the answers) Agents ਅਕਸਰ ਗਲਤ ਸਵਾਲ ਪੁੱਛਦੇ ਹਨ। ਜੇਕਰ ਉਹ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸਵਾਲ ਪੁੱਛਦੇ ਹਨ, ਤਾਂ ਅੰਤ ਵਿੱਚ ਤੁਹਾਨੂੰ ਉਹਨਾਂ ਲਈ ਕੰਮ ਕਰਨਾ ਪੈਂਦਾ ਹੈ। ਮੈਂ ਇਸ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ। Planner ਅਜੇ ਵੀ ਸਵਾਲ ਪੁੱਛਦਾ ਹੈ, ਪਰ ਇਹ ਇੱਕ ਸਿਫ਼ਾਰਸ਼ੀ ਜਵਾਬ (recommended answer) ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਬੱਸ ਉਸ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨੀ ਹੁੰਦੀ ਹੈ ਜਾਂ ਥੋੜ੍ਹਾ ਬਦਲਣਾ ਹੁੰਦਾ ਹੈ। ਇਹ ਮੈਨੂਅਲ ਡੇਟਾ ਐਂਟਰੀ ਤੋਂ ਬਿਨਾਂ ਯੋਜਨਾ ਨੂੰ ਸਹੀ ਰੱਖਦਾ ਹੈ।
• ਸਿਰਫ਼ ਸੂਚੀ ਨਹੀਂ, ਸਗੋਂ ਸੰਦਰਭ (context) ਵੀ ਭੇਜੋ ਜੇਕਰ ਤੁਸੀਂ executor ਨੂੰ ਸਿਰਫ਼ ਕਦਮਾਂ ਦੀ ਇੱਕ ਸੂਚੀ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਉਹ ਤਰਕ (reasoning) ਗੁਆ ਲੈਂਦਾ ਹੈ। ਮੈਂ planner ਨੂੰ ਕਦਮਾਂ ਦੇ ਨਾਲ-ਨਾਲ ਅੰਦਾਜ਼ੇ ਅਤੇ ਜੋਖਮਾਂ ਨੂੰ ਵੀ ਭੇਜਣ ਲਈ ਕਿਹਾ। ਹੁਣ executor ਨੂੰ ਹਰ ਕਾਰਵਾਈ ਦੇ ਪਿੱਛੇ ਦਾ "ਕਿਉਂ" ਪਤਾ ਹੁੰਦਾ ਹੈ।
• ਖ਼ਤਰੇ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰੋ (Label the danger) ਯੋਜਨਾ ਉਦੋਂ ਹੀ ਸੁਰੱਖਿਅਤ ਹੁੰਦੀ ਹੈ ਜੇਕਰ ਤੁਸੀਂ ਜੋਖਮਾਂ ਨੂੰ ਦੇਖ ਸਕਦੇ ਹੋ। ਮੇਰਾ ਸਿਸਟਮ ਡਿਲੀਟ ਕਰਨ ਜਾਂ ਰੀਨੇਮ (rename) ਕਰਨ ਵਰਗੀਆਂ ਵਿਨਾਸ਼ਕਾਰੀ ਕਾਰਵਾਈਆਂ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰਦਾ ਹੈ। ਜਦੋਂ agent ਕਿਸੇ ਵਿਨਾਸ਼ਕਾਰੀ ਕਦਮ 'ਤੇ ਪਹੁੰਚਦਾ ਹੈ, ਤਾਂ ਇਹ ਰੁਕ ਜਾਂਦਾ ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਪੁੱਛਦਾ ਹੈ।
• ਡੇਟਾ ਨੂੰ ਫੈਸਲਾਕੁਨ (tiebreaker) ਵਜੋਂ ਵਰਤੋ ਜੇਕਰ ਇੱਕ agent ਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਕੋਈ ਕਦਮ ਅਸਫਲ ਰਿਹਾ ਹੈ ਅਤੇ ਤੁਸੀਂ ਉਸਨੂੰ ਦੁਬਾਰਾ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਕਹਿੰਦੇ ਹੋ, ਤਾਂ ਉਹ ਸਿਰਫ਼ ਅੰਨ੍ਹੇਵਾਹ ਅੱਗੋਂ ਨਹੀਂ ਮੰਨਦਾ। ਇਹ ਅਸਲ ਪਲੇਟਫਾਰਮ ਡੇਟਾ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਡੇਟਾ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਕੰਮ ਪਹਿਲਾਂ ਹੀ ਹੋ ਚੁੱਕਾ ਹੈ, ਤਾਂ agent ਤੁਹਾਡੇ ਦਾਅਵੇ ਨਾਲੋਂ ਡੇਟਾ 'ਤੇ ਭਰੋਸਾ ਕਰਦਾ ਹੈ।
ਸੁਰੱਖਿਆ ਬਾਰੇ ਸੱਚਾਈ: Plan mode prompt injection ਜਾਂ ਅਜਿਹੇ ਉਪਭੋਗਤਾ ਨੂੰ ਨਹੀਂ ਰੋਕਦਾ ਜੋ ਬਿਨਾਂ ਦੇਖੇ "approve" 'ਤੇ ਕਲਿੱਕ ਕਰ ਦਿੰਦਾ ਹੈ। ਇਹ ਜ਼ਿੰਮੇਵਾਰੀ "ਮਾਡਲ 'ਤੇ ਭਰੋਸਾ ਕਰਨ" ਤੋਂ ਹਟਾ ਕੇ "ਜਾਂਚ ਕਰਨ ਲਈ ਇਨਸਾਨ 'ਤੇ ਭਰੋਸਾ ਕਰਨ" ਵੱਲ ਲੈ ਜਾਂਦਾ ਹੈ।
ਢਾਂਚਾ ਗਾਰਡਰੇਲ (guardrails) ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਪਰ ਤੁਹਾਡੀ ਸਮੀਖਿਆ ਅੰਤਮ ਸੁਰੱਖਿਆ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।
Optional learning community: https://t.me/GyaanSetuAi
