ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਲੂਪ ਬਣਾਉਣਾ

ਇੱਕ ਡੈਮੋ ਏਜੰਟ ਬਣਾਉਣਾ ਆਸਾਨ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਬਣਾਉਣਾ ਮੁਸ਼ਕਲ ਹੈ।

ਇੱਕ ਡੈਮੋ ਵਿੱਚ, ਲੂਪ ਸਰਲ ਹੁੰਦਾ ਹੈ: ਦੇਖੋ (observe), ਫੈਸਲਾ ਲਓ (decide), ਕੰਮ ਕਰੋ (act), ਚੈੱਕ ਕਰੋ (check), ਦੁਹਰਾਓ (repeat)। ਮਾਡਲ ਇੱਕ ਨਤੀਜਾ ਦੇਖਦਾ ਹੈ ਅਤੇ ਅਗਲੇ ਕਦਮ ਵੱਲ ਵਧਦਾ ਹੈ।

ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ, ਉਸੇ ਲੂਪ ਨੂੰ ਸਖ਼ਤ ਨਿਯਮਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਏਜੰਟ ਸਿਰਫ਼ ਇੱਕ ਮਾਡਲ ਅਤੇ ਕੁਝ ਟੂਲਜ਼ ਨਹੀਂ ਹੁੰਦਾ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਲੂਪ ਹੈ ਜੋ ਇਸਨੂੰ ਸਹੀ ਰੱਖਣ ਲਈ ਇੱਕ ਢਾਂਚੇ (structure) ਵਿੱਚ ਲਪੇਟਿਆ ਗਿਆ ਹੁੰਦਾ ਹੈ।

ਸਭ ਤੋਂ ਵੱਡਾ ਜਾਲ ਟੂਲ ਦੇ ਜਵਾਬਾਂ (tool responses) 'ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਹੈ।

ਕਲਪਨਾ ਕਰੋ ਕਿ ਇੱਕ ਏਜੰਟ ਨੂੰ ਇੱਕ ਆਰਡਰ ਰੱਦ ਕਰਨ ਅਤੇ ਰਿਫੰਡ ਜਾਰੀ ਕਰਨ ਦੀ ਲੋੜ ਹੈ।

ਇੱਕ ਡੈਮੋ ਵਿੱਚ, ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ, ਇਹ ਇੱਕ ਤਬਾਹੀ ਹੈ।

200 OK ਦਾ ਅਕਸਰ ਮਤਲਬ ਹੁੰਦਾ ਹੈ ਕਿ ਬੇਨਤੀ (request) ਸਵੀਕਾਰ ਕਰ ਲਈ ਗਈ ਸੀ, ਨਾ ਕਿ ਇਹ ਕਿ ਕੰਮ ਪੂਰਾ ਹੋ ਗਿਆ ਹੈ। ਰੱਦ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਜੇ ਵੀ ਕਤਾਰ (queue) ਵਿੱਚ ਲਟਕਦੀ ਹੋ ਸਕਦੀ ਹੈ। ਜੇਕਰ ਏਜੰਟ ਰੱਦ ਹੋਣ ਦੀ ਪੁਸ਼ਟੀ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਰਿਫੰਡ ਜਾਰੀ ਕਰ ਦਿੰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਅੰਦਾਜ਼ੇ ਦੇ ਅਧਾਰ 'ਤੇ ਪੈਸੇ ਭੇਜ ਰਹੇ ਹੁੰਦੇ ਹੋ।

ਤੁਹਾਨੂੰ ਇੱਕ ਨਿਯਮ ਦੀ ਪਾਲਣਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ: ਇੱਕ ਟੂਲ ਦਾ ਜਵਾਬ ਬੇਨਤੀ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ, ਨਾ ਕਿ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਦੁਨੀਆ ਦੀ ਅਸਲ ਸਥਿਤੀ ਦਾ।

ਇੱਕ ਸੁਰੱਖਿਅਤ ਪ੍ਰੋਡਕਸ਼ਨ ਲੂਪ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਇਹਨਾਂ ਤੱਤਾਂ (components) ਦੀ ਲੋੜ ਹੈ:

• ਟੂਲ ਕੰਟਰੈਕਟ (Tool Contracts): ਹਰ ਟੂਲ ਨੂੰ ਆਪਣੇ ਇਨਪੁਟ, ਆਉਟਪੁੱਟ, ਫੇਲ੍ਹ ਹੋਣ ਦੇ ਤਰੀਕਿਆਂ (failure modes) ਅਤੇ ਇੱਕ idempotency key ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। • ਵੈਰੀਫਿਕੇਸ਼ਨ ਗੇਟਸ (Verification Gates): ਸਿਰਫ਼ ਇਹ ਨਾ ਚੈੱਕ ਕਰੋ ਕਿ ਟੂਲ ਨੇ ਸਫਲਤਾ ਕੋਡ (success code) ਵਾਪਸ ਕੀਤਾ ਹੈ ਜਾਂ ਨਹੀਂ। ਇਹ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਿ ਬਦਲਾਅ ਹੋ ਗਿਆ ਹੈ, ਦੁਨੀਆ ਦੀ ਅਸਲ ਸਥਿਤੀ ਨੂੰ ਦੁਬਾਰਾ ਪੜ੍ਹੋ। • ਵਰਕਿੰਗ ਸਟੇਟ (Working State): ਤੱਥਾਂ (facts) ਨੂੰ ਚੈਟ ਇਤਿਹਾਸ ਤੋਂ ਵੱਖ ਰੱਖੋ। ਇਹ ਏਜੰਟ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਟੈਕਸਟ ਦੇ ਅਧਾਰ 'ਤੇ ਭਰਮ (hallucinating) ਵਿੱਚ ਜਾਣ ਤੋਂ ਰੋਕਦਾ ਹੈ। • ਅਪਰੂਵਲ ਗੇਟਸ (Approval Gates): ਉੱਚ-ਜੋਖਮ ਵਾਲੇ ਕੰਮਾਂ ਲਈ ਇਰਾਦੇ (intent) 'ਤੇ ਮਨੁੱਖੀ ਮਨਜ਼ੂਰੀ ਲੈਣ ਲਈ ਇਨਸਾਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ। • ਸਟੌਪ ਰੂਲਜ਼ (Stop Rules): ਲਗਾਤਾਰ ਚੱਲਦੇ ਰਹਿਣ ਵਾਲੇ ਲੂਪਸ ਨੂੰ ਰੋਕਣ ਲਈ ਕਦਮਾਂ, ਲਾਗਤ, ਸਮੇਂ ਅਤੇ ਚੁੱਪ (silence) 'ਤੇ ਸੀਮਾਵਾਂ ਨਿਰਧਾਰਤ ਕਰੋ।

ਲੂਪ ਦਾ ਢਾਂਚਾ ਨਹੀਂ ਬਦਲਦਾ। ਲਾਗੂ ਕਰਨ ਦਾ ਤਰੀਕਾ (implementation) ਵਧੇਰੇ ਸਖ਼ਤ ਹੋ ਜਾਂਦਾ ਹੈ।

ਅਹਿਮ ਕਾਰਵਾਈਆਂ ਲਈ, ਤੁਹਾਡੇ "ਚੈੱਕ" ਕਦਮ ਦੇ ਦੋ ਹਿੱਸੇ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ:

  1. ਵੈਰੀਫਾਈ (Verify): ਕੀ ਦੁਨੀਆ ਅਸਲ ਵਿੱਚ ਉਮੀਦ ਅਨੁਸਾਰ ਬਦਲ ਗਈ ਹੈ?
  2. ਕਮਿਟ (Commit): ਹੁਣ ਜਦੋਂ ਕਿ ਇਸਦੀ ਪੁਸ਼ਟੀ ਹੋ ਗਈ ਹੈ, ਕੀ ਅਗਲੇ ਕਦਮ ਵੱਲ ਵਧਣਾ ਸੁਰੱਖਿਅਤ ਹੈ?

ਸਭ ਤੋਂ ਸੁਰੱਖਿਅਤ ਏਜੰਟ ਉਹ ਹੈ ਜਿਸ ਦੀਆਂ ਸੀਮਾਵਾਂ ਸਭ ਤੋਂ ਵੱਧ ਹਨ। ਭਰੋਸੇਯੋਗਤਾ ਮਾਡਲ ਨੂੰ ਵਧੇਰੇ ਆਜ਼ਾਦੀ ਦੇਣ ਨਾਲ ਨਹੀਂ, ਸਗੋਂ ਇਸਦੇ ਆਲੇ-ਦੁਆਲੇ ਸਪਸ਼ਟ ਸੀਮਾਵਾਂ ਰੱਖਣ ਨਾਲ ਆਉਂਦੀ ਹੈ।

ਸਰੋਤ: https://dev.to/gursharansingh/ai-agents-in-practice-part-6-building-the-production-agent-loop-2lfi

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi