ਉਹ Agents ਜੋ ਅਸਲ ਵਿੱਚ ਲਾਂਚ ਕੀਤੇ ਜਾਂਦੇ ਹਨ

Agent hype cycle ਦਾ ਇੱਕ ਸਪੱਸ਼ਟ ਜਵਾਬ ਹੈ। ਜੋ ਟੀਮਾਂ production agents ਨਾਲ ਜਿੱਤ ਰਹੀਆਂ ਹਨ, ਉਹ autonomous swarms ਨਹੀਂ ਬਣਾਉਂਦੀਆਂ। ਉਹ ਬੋਰਿੰਗ ਸਿਸਟਮ ਬਣਾਉਂਦੀਆਂ ਹਨ।

ਮੈਂ ਇੱਕ ਮਹੀਨੇ ਤੱਕ ਦੇਖਿਆ ਕਿ production ਵਿੱਚ ਕੀ ਕੰਮ ਕਰਦਾ ਹੈ। ਪੈਟਰਨ ਸਪੱਸ਼ਟ ਹੈ। ਉਹ agents ਜੋ ਪੈਸਾ ਕਮਾਉਂਦੇ ਹਨ ਜਾਂ ਸਮਾਂ ਬਚਾਉਂਦੇ ਹਨ, ਉਹਨਾਂ ਵਿੱਚ endless loops ਨਹੀਂ ਹੁੰਦੇ। ਉਹ observable ਹੁੰਦੇ ਹਨ। ਉਹ bounded ਹੁੰਦੇ ਹਨ। ਜਦੋਂ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਉਹ ਮਨੁੱਖੀ ਮਦਦ ਮੰਗਦੇ ਹਨ।

ਇਹ ਤੁਹਾਡੇ ਦੁਆਰਾ agent platforms ਦੇ ਮੁਲਾਂਕਣ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ।

Production ਵਿੱਚ agents ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੀਆਂ ਟੀਮਾਂ ਇਹਨਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀਆਂ ਹਨ:

  • Manual prompt construction
  • Off-the-shelf models
  • ਮਨੁੱਖੀ ਦਖਲਅੰਦਾਜ਼ੀ ਤੋਂ ਪਹਿਲਾਂ 10 ਜਾਂ ਇਸ ਤੋਂ ਘੱਟ ਕਦਮਾਂ ਵਾਲੀ bounded execution

ਇਹ ਇੰਜੀਨੀਅਰਿੰਗ ਅਨੁਸ਼ਾਸਨ ਹੈ।

Demos ਪੂਰੀ autonomy ਵਾਲੇ self-correcting agents ਦਿਖਾਉਂਦੇ ਹਨ। ਪਰ ਜੋ agents ਅਸਲ ਵਿੱਚ ਲਾਂਚ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਉਹ ਵੱਖਰੇ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ। ਉਹ explicit gates ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।

ਇੱਕ customer service agent 5 ਕਦਮਾਂ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ ਅਤੇ ਫਿਰ ਅੱਗੇ ਭੇਜ ਦਿੰਦਾ ਹੈ (escalates)। ਇੱਕ coding agent ਟੈਸਟ ਚਲਾਉਂਦਾ ਹੈ ਪਰ review ਤੋਂ ਬਿਨਾਂ code merge ਨਹੀਂ ਕਰਦਾ। ਇੱਕ data agent query ਚਲਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਮਨਜ਼ੂਰੀ ਮੰਗਦਾ ਹੈ। ਇਹ ਉਹ architectural ਚੋਣਾਂ ਹਨ ਜੋ ਕੰਮ ਕਰਦੀਆਂ ਹਨ।

ਸਫਲ agents ਸੀਮਤ (narrow) ਅਤੇ ਦੁਹਰਾਉਣਯੋਗ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਦੇ ਹਨ। ਉਹ returns ਸੰਭਾਲਦੇ ਹਨ, tickets ਨੂੰ triage ਕਰਦੇ ਹਨ, ਜਾਂ compliance ਦੇ ਮੁੱਦਿਆਂ ਨੂੰ ਫਲੈਗ ਕਰਦੇ ਹਨ। ਸੀਮਤ scope ਦਾ ਮਤਲਬ ਹੈ ਅਨੁਮਾਨਿਤ ਅਸਫਲਤਾਵਾਂ (predictable failures) ਅਤੇ ਆਸਾਨ debugging।

Agents ਨੂੰ ਲਾਂਚ ਕਰਨ ਦਾ ਸਭ ਤੋਂ ਔਖਾ ਹਿੱਸਾ ਉਹਨਾਂ ਨੂੰ ਹੋਰ ਸਮਾਰਟ ਬਣਾਉਣਾ ਨਹੀਂ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ visible ਅਤੇ governable ਬਣਾਉਣਾ ਹੈ।

ਟੀਮਾਂ ਅਕਸਰ ਅਸਫਲ ਹੁੰਦੀਆਂ ਹਨ ਕਿਉਂਕਿ:

  • ਜਦੋਂ agent ਅਸਫਲ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਉਹ ਇਹ ਨਹੀਂ ਦੱਸ ਸਕਦੇ ਕਿ ਉਸਨੇ ਕੀ ਕੀਤਾ ਸੀ
  • ਉਹ ਕਿਸੇ ਮਾੜੇ ਨਤੀਜੇ ਦਾ ਪਤਾ (trace) ਨਹੀਂ ਲਗਾ ਸਕਦੇ
  • ਉਹ ਲਾਗਤ ਦੀਆਂ ਸੀਮਾਵਾਂ (cost boundaries) ਸੈੱਟ ਨਹੀਂ ਕਰ ਸਕਦੇ
  • ਉਹ tool approvals ਨੂੰ ਲਾਗੂ ਨਹੀਂ ਕਰ ਸਕਦੇ
  • ਉਹ ਕਿਸੇ ਫੈਸਲੇ ਨੂੰ ਸਮਝਣ ਲਈ session ਨੂੰ replay ਨਹੀਂ ਕਰ ਸਕਦੇ

ਇਹ infrastructure ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਹਨ।

ਜੇਕਰ ਤੁਸੀਂ ਕੋਈ platform ਚੁਣਦੇ ਹੋ, ਤਾਂ ਆਪਣੇ ਸਵਾਲ ਬਦਲ ਲਓ।

  • ਰਫਤਾਰ (speed) ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ ਕੀ ਤੁਸੀਂ ਹਰ ਫੈਸਲੇ ਅਤੇ trace ਨੂੰ ਦੇਖ ਸਕਦੇ ਹੋ।
  • model support ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ ਕੀ ਤੁਸੀਂ ਇੱਕੋ ਥਾਂ ਤੋਂ ਕਈ runtimes ਨੂੰ govern ਕਰ ਸਕਦੇ ਹੋ।
  • autonomy ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ human gates ਜੋੜਨਾ ਕਿੰਨਾ ਆਸਾਨ ਹੈ।

ਜੇਤੂ infrastructure observation, governance, ਅਤੇ bounded autonomy ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ control plane ਹੈ। ਇਹ ਭਰੋਸੇਯੋਗ agents ਨੂੰ ਉਹਨਾਂ ਤੋਂ ਵੱਖ ਕਰਦਾ ਹੈ ਜੋ ਰਾਤ ਦੇ 3 ਵਜੇ production ਨੂੰ ਵਿਗਾੜ ਦਿੰਦੇ ਹਨ।

Production ਟੀਮਾਂ ਹੁਣ ਇਹ ਨਹੀਂ ਪੁੱਛਦੀਆਂ ਕਿ ਕੀ ਉਹ agents ਬਣਾ ਸਕਦੇ ਹਨ। ਉਹ ਪੁੱਛਦੀਆਂ ਹਨ ਕਿ ਉਹਨਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਕਿਵੇਂ ਚਲਾਇਆ ਜਾਵੇ।

ਬੋਰਿੰਗ infrastructure ਜਿੱਤਦਾ ਹੈ।

Source: https://dev.to/paultwist/the-agents-that-actually-ship-why-boring-beats-autonomous-49li

Optional learning community: https://t.me/GyaanSetuAi