𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

📅3 hours ago⏱2 min read

ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਲੂਪ ਬਣਾਉਣਾ

ਇੱਕ ਡੈਮੋ ਏਜੰਟ ਬਣਾਉਣਾ ਆਸਾਨ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਬਣਾਉਣਾ ਮੁਸ਼ਕਲ ਹੈ।

ਇੱਕ ਡੈਮੋ ਵਿੱਚ, ਲੂਪ ਸਰਲ ਹੁੰਦਾ ਹੈ: ਦੇਖੋ (observe), ਫੈਸਲਾ ਲਓ (decide), ਕੰਮ ਕਰੋ (act), ਚੈੱਕ ਕਰੋ (check), ਦੁਹਰਾਓ (repeat)। ਮਾਡਲ ਇੱਕ ਨਤੀਜਾ ਦੇਖਦਾ ਹੈ ਅਤੇ ਅਗਲੇ ਕਦਮ ਵੱਲ ਵਧਦਾ ਹੈ।

ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ, ਉਸੇ ਲੂਪ ਨੂੰ ਸਖ਼ਤ ਨਿਯਮਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਸਿਰਫ਼ ਇੱਕ ਮਾਡਲ ਅਤੇ ਕੁਝ ਟੂਲਜ਼ ਨਹੀਂ ਹੁੰਦਾ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਲੂਪ ਹੈ ਜੋ ਇਸਨੂੰ ਸਹੀ ਰੱਖਣ ਲਈ ਇੱਕ ਢਾਂਚੇ (structure) ਵਿੱਚ ਲਪੇਟਿਆ ਗਿਆ ਹੁੰਦਾ ਹੈ।

ਸਭ ਤੋਂ ਵੱਡਾ ਜਾਲ ਟੂਲ ਦੇ ਜਵਾਬਾਂ (tool responses) 'ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਹੈ।

ਕਲਪਨਾ ਕਰੋ ਕਿ ਇੱਕ ਏਜੰਟ ਨੂੰ ਇੱਕ ਆਰਡਰ ਰੱਦ ਕਰਨ ਅਤੇ ਰਿਫੰਡ ਜਾਰੀ ਕਰਨ ਦੀ ਲੋੜ ਹੈ।

ਏਜੰਟ cancel_order ਕਾਲ ਕਰਦਾ ਹੈ।
ਟੂਲ 200 OK ਵਾਪਸ ਕਰਦਾ ਹੈ।
ਏਜੰਟ ਤੁਰੰਤ issue_refund ਕਾਲ ਕਰਦਾ ਹੈ।

ਇੱਕ ਡੈਮੋ ਵਿੱਚ, ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ, ਇਹ ਇੱਕ ਤਬਾਹੀ ਹੈ।

200 OK ਦਾ ਅਕਸਰ ਮਤਲਬ ਹੁੰਦਾ ਹੈ ਕਿ ਬੇਨਤੀ (request) ਸਵੀਕਾਰ ਕਰ ਲਈ ਗਈ ਸੀ, ਨਾ ਕਿ ਇਹ ਕਿ ਕੰਮ ਪੂਰਾ ਹੋ ਗਿਆ ਹੈ। ਰੱਦ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਜੇ ਵੀ ਕਤਾਰ (queue) ਵਿੱਚ ਲਟਕਦੀ ਹੋ ਸਕਦੀ ਹੈ। ਜੇਕਰ ਏਜੰਟ ਰੱਦ ਹੋਣ ਦੀ ਪੁਸ਼ਟੀ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਰਿਫੰਡ ਜਾਰੀ ਕਰ ਦਿੰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਅੰਦਾਜ਼ੇ ਦੇ ਅਧਾਰ 'ਤੇ ਪੈਸੇ ਭੇਜ ਰਹੇ ਹੁੰਦੇ ਹੋ।

ਤੁਹਾਨੂੰ ਇੱਕ ਨਿਯਮ ਦੀ ਪਾਲਣਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ: ਇੱਕ ਟੂਲ ਦਾ ਜਵਾਬ ਬੇਨਤੀ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ, ਨਾ ਕਿ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਦੁਨੀਆ ਦੀ ਅਸਲ ਸਥਿਤੀ ਦਾ।

ਇੱਕ ਸੁਰੱਖਿਅਤ ਪ੍ਰੋਡਕਸ਼ਨ ਲੂਪ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਇਹਨਾਂ ਤੱਤਾਂ (components) ਦੀ ਲੋੜ ਹੈ:

• ਟੂਲ ਕੰਟਰੈਕਟ (Tool Contracts): ਹਰ ਟੂਲ ਨੂੰ ਆਪਣੇ ਇਨਪੁਟ, ਆਉਟਪੁੱਟ, ਫੇਲ੍ਹ ਹੋਣ ਦੇ ਤਰੀਕਿਆਂ (failure modes) ਅਤੇ ਇੱਕ idempotency key ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। • ਵੈਰੀਫਿਕੇਸ਼ਨ ਗੇਟਸ (Verification Gates): ਸਿਰਫ਼ ਇਹ ਨਾ ਚੈੱਕ ਕਰੋ ਕਿ ਟੂਲ ਨੇ ਸਫਲਤਾ ਕੋਡ (success code) ਵਾਪਸ ਕੀਤਾ ਹੈ ਜਾਂ ਨਹੀਂ। ਇਹ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਿ ਬਦਲਾਅ ਹੋ ਗਿਆ ਹੈ, ਦੁਨੀਆ ਦੀ ਅਸਲ ਸਥਿਤੀ ਨੂੰ ਦੁਬਾਰਾ ਪੜ੍ਹੋ। • ਵਰਕਿੰਗ ਸਟੇਟ (Working State): ਤੱਥਾਂ (facts) ਨੂੰ ਚੈਟ ਇਤਿਹਾਸ ਤੋਂ ਵੱਖ ਰੱਖੋ। ਇਹ ਏਜੰਟ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਟੈਕਸਟ ਦੇ ਅਧਾਰ 'ਤੇ ਭਰਮ (hallucinating) ਵਿੱਚ ਜਾਣ ਤੋਂ ਰੋਕਦਾ ਹੈ। • ਅਪਰੂਵਲ ਗੇਟਸ (Approval Gates): ਉੱਚ-ਜੋਖਮ ਵਾਲੇ ਕੰਮਾਂ ਲਈ ਇਰਾਦੇ (intent) 'ਤੇ ਮਨੁੱਖੀ ਮਨਜ਼ੂਰੀ ਲੈਣ ਲਈ ਇਨਸਾਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ। • ਸਟੌਪ ਰੂਲਜ਼ (Stop Rules): ਲਗਾਤਾਰ ਚੱਲਦੇ ਰਹਿਣ ਵਾਲੇ ਲੂਪਸ ਨੂੰ ਰੋਕਣ ਲਈ ਕਦਮਾਂ, ਲਾਗਤ, ਸਮੇਂ ਅਤੇ ਚੁੱਪ (silence) 'ਤੇ ਸੀਮਾਵਾਂ ਨਿਰਧਾਰਤ ਕਰੋ।

ਲੂਪ ਦਾ ਢਾਂਚਾ ਨਹੀਂ ਬਦਲਦਾ। ਲਾਗੂ ਕਰਨ ਦਾ ਤਰੀਕਾ (implementation) ਵਧੇਰੇ ਸਖ਼ਤ ਹੋ ਜਾਂਦਾ ਹੈ।

ਅਹਿਮ ਕਾਰਵਾਈਆਂ ਲਈ, ਤੁਹਾਡੇ "ਚੈੱਕ" ਕਦਮ ਦੇ ਦੋ ਹਿੱਸੇ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ:

ਵੈਰੀਫਾਈ (Verify): ਕੀ ਦੁਨੀਆ ਅਸਲ ਵਿੱਚ ਉਮੀਦ ਅਨੁਸਾਰ ਬਦਲ ਗਈ ਹੈ?
ਕਮਿਟ (Commit): ਹੁਣ ਜਦੋਂ ਕਿ ਇਸਦੀ ਪੁਸ਼ਟੀ ਹੋ ਗਈ ਹੈ, ਕੀ ਅਗਲੇ ਕਦਮ ਵੱਲ ਵਧਣਾ ਸੁਰੱਖਿਅਤ ਹੈ?

ਸਭ ਤੋਂ ਸੁਰੱਖਿਅਤ ਏਜੰਟ ਉਹ ਹੈ ਜਿਸ ਦੀਆਂ ਸੀਮਾਵਾਂ ਸਭ ਤੋਂ ਵੱਧ ਹਨ। ਭਰੋਸੇਯੋਗਤਾ ਮਾਡਲ ਨੂੰ ਵਧੇਰੇ ਆਜ਼ਾਦੀ ਦੇਣ ਨਾਲ ਨਹੀਂ, ਸਗੋਂ ਇਸਦੇ ਆਲੇ-ਦੁਆਲੇ ਸਪਸ਼ਟ ਸੀਮਾਵਾਂ ਰੱਖਣ ਨਾਲ ਆਉਂਦੀ ਹੈ।

ਸਰੋਤ: https://dev.to/gursharansingh/ai-agents-in-practice-part-6-building-the-production-agent-loop-2lfi

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

Continue reading

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

ਇੱਕ ਖੁਦਮੁਖਤਿਆਰ ਏਜੰਟ ਟੀਮ ਬਣਾਉਣਾ

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗣𝗮𝘀𝘀𝗲𝗱 𝗔𝗹𝗹 𝗧𝗲𝘀𝘁𝘀 — 𝗧𝗵𝗲𝗻 𝗙𝗮𝗶𝗹𝗲𝗱 𝗶𝗻 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻

𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗜𝘀 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁. 𝗛𝗲𝗿𝗲'𝘀 𝗪𝗵𝗮𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗜𝘀.