The Agents That Actually Ship

Translated for your language. Read the original.

AI-assisted draft.

ਉਹ Agents ਜੋ ਅਸਲ ਵਿੱਚ ਲਾਂਚ ਕੀਤੇ ਜਾਂਦੇ ਹਨ

Agent hype cycle ਦਾ ਇੱਕ ਸਪੱਸ਼ਟ ਜਵਾਬ ਹੈ। ਜੋ ਟੀਮਾਂ production agents ਨਾਲ ਜਿੱਤ ਰਹੀਆਂ ਹਨ, ਉਹ autonomous swarms ਨਹੀਂ ਬਣਾਉਂਦੀਆਂ। ਉਹ ਬੋਰਿੰਗ ਸਿਸਟਮ ਬਣਾਉਂਦੀਆਂ ਹਨ।

ਮੈਂ ਇੱਕ ਮਹੀਨੇ ਤੱਕ ਦੇਖਿਆ ਕਿ production ਵਿੱਚ ਕੀ ਕੰਮ ਕਰਦਾ ਹੈ। ਪੈਟਰਨ ਸਪੱਸ਼ਟ ਹੈ। ਉਹ agents ਜੋ ਪੈਸਾ ਕਮਾਉਂਦੇ ਹਨ ਜਾਂ ਸਮਾਂ ਬਚਾਉਂਦੇ ਹਨ, ਉਹਨਾਂ ਵਿੱਚ endless loops ਨਹੀਂ ਹੁੰਦੇ। ਉਹ observable ਹੁੰਦੇ ਹਨ। ਉਹ bounded ਹੁੰਦੇ ਹਨ। ਜਦੋਂ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਉਹ ਮਨੁੱਖੀ ਮਦਦ ਮੰਗਦੇ ਹਨ।

ਇਹ ਤੁਹਾਡੇ ਦੁਆਰਾ agent platforms ਦੇ ਮੁਲਾਂਕਣ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ।

Production ਵਿੱਚ agents ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੀਆਂ ਟੀਮਾਂ ਇਹਨਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀਆਂ ਹਨ:

Manual prompt construction
Off-the-shelf models
ਮਨੁੱਖੀ ਦਖਲਅੰਦਾਜ਼ੀ ਤੋਂ ਪਹਿਲਾਂ 10 ਜਾਂ ਇਸ ਤੋਂ ਘੱਟ ਕਦਮਾਂ ਵਾਲੀ bounded execution

ਇਹ ਇੰਜੀਨੀਅਰਿੰਗ ਅਨੁਸ਼ਾਸਨ ਹੈ।

Demos ਪੂਰੀ autonomy ਵਾਲੇ self-correcting agents ਦਿਖਾਉਂਦੇ ਹਨ। ਪਰ ਜੋ agents ਅਸਲ ਵਿੱਚ ਲਾਂਚ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਉਹ ਵੱਖਰੇ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ। ਉਹ explicit gates ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।

ਇੱਕ customer service agent 5 ਕਦਮਾਂ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ ਅਤੇ ਫਿਰ ਅੱਗੇ ਭੇਜ ਦਿੰਦਾ ਹੈ (escalates)। ਇੱਕ coding agent ਟੈਸਟ ਚਲਾਉਂਦਾ ਹੈ ਪਰ review ਤੋਂ ਬਿਨਾਂ code merge ਨਹੀਂ ਕਰਦਾ। ਇੱਕ data agent query ਚਲਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਮਨਜ਼ੂਰੀ ਮੰਗਦਾ ਹੈ। ਇਹ ਉਹ architectural ਚੋਣਾਂ ਹਨ ਜੋ ਕੰਮ ਕਰਦੀਆਂ ਹਨ।

ਸਫਲ agents ਸੀਮਤ (narrow) ਅਤੇ ਦੁਹਰਾਉਣਯੋਗ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਦੇ ਹਨ। ਉਹ returns ਸੰਭਾਲਦੇ ਹਨ, tickets ਨੂੰ triage ਕਰਦੇ ਹਨ, ਜਾਂ compliance ਦੇ ਮੁੱਦਿਆਂ ਨੂੰ ਫਲੈਗ ਕਰਦੇ ਹਨ। ਸੀਮਤ scope ਦਾ ਮਤਲਬ ਹੈ ਅਨੁਮਾਨਿਤ ਅਸਫਲਤਾਵਾਂ (predictable failures) ਅਤੇ ਆਸਾਨ debugging।

Agents ਨੂੰ ਲਾਂਚ ਕਰਨ ਦਾ ਸਭ ਤੋਂ ਔਖਾ ਹਿੱਸਾ ਉਹਨਾਂ ਨੂੰ ਹੋਰ ਸਮਾਰਟ ਬਣਾਉਣਾ ਨਹੀਂ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ visible ਅਤੇ governable ਬਣਾਉਣਾ ਹੈ।

ਟੀਮਾਂ ਅਕਸਰ ਅਸਫਲ ਹੁੰਦੀਆਂ ਹਨ ਕਿਉਂਕਿ:

ਜਦੋਂ agent ਅਸਫਲ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਉਹ ਇਹ ਨਹੀਂ ਦੱਸ ਸਕਦੇ ਕਿ ਉਸਨੇ ਕੀ ਕੀਤਾ ਸੀ
ਉਹ ਕਿਸੇ ਮਾੜੇ ਨਤੀਜੇ ਦਾ ਪਤਾ (trace) ਨਹੀਂ ਲਗਾ ਸਕਦੇ
ਉਹ ਲਾਗਤ ਦੀਆਂ ਸੀਮਾਵਾਂ (cost boundaries) ਸੈੱਟ ਨਹੀਂ ਕਰ ਸਕਦੇ
ਉਹ tool approvals ਨੂੰ ਲਾਗੂ ਨਹੀਂ ਕਰ ਸਕਦੇ
ਉਹ ਕਿਸੇ ਫੈਸਲੇ ਨੂੰ ਸਮਝਣ ਲਈ session ਨੂੰ replay ਨਹੀਂ ਕਰ ਸਕਦੇ

ਇਹ infrastructure ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਹਨ।

ਜੇਕਰ ਤੁਸੀਂ ਕੋਈ platform ਚੁਣਦੇ ਹੋ, ਤਾਂ ਆਪਣੇ ਸਵਾਲ ਬਦਲ ਲਓ।

ਰਫਤਾਰ (speed) ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ ਕੀ ਤੁਸੀਂ ਹਰ ਫੈਸਲੇ ਅਤੇ trace ਨੂੰ ਦੇਖ ਸਕਦੇ ਹੋ।
model support ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ ਕੀ ਤੁਸੀਂ ਇੱਕੋ ਥਾਂ ਤੋਂ ਕਈ runtimes ਨੂੰ govern ਕਰ ਸਕਦੇ ਹੋ।
autonomy ਬਾਰੇ ਨਾ ਪੁੱਛੋ। ਇਹ ਪੁੱਛੋ ਕਿ human gates ਜੋੜਨਾ ਕਿੰਨਾ ਆਸਾਨ ਹੈ।

ਜੇਤੂ infrastructure observation, governance, ਅਤੇ bounded autonomy ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ control plane ਹੈ। ਇਹ ਭਰੋਸੇਯੋਗ agents ਨੂੰ ਉਹਨਾਂ ਤੋਂ ਵੱਖ ਕਰਦਾ ਹੈ ਜੋ ਰਾਤ ਦੇ 3 ਵਜੇ production ਨੂੰ ਵਿਗਾੜ ਦਿੰਦੇ ਹਨ।

Production ਟੀਮਾਂ ਹੁਣ ਇਹ ਨਹੀਂ ਪੁੱਛਦੀਆਂ ਕਿ ਕੀ ਉਹ agents ਬਣਾ ਸਕਦੇ ਹਨ। ਉਹ ਪੁੱਛਦੀਆਂ ਹਨ ਕਿ ਉਹਨਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਕਿਵੇਂ ਚਲਾਇਆ ਜਾਵੇ।

ਬੋਰਿੰਗ infrastructure ਜਿੱਤਦਾ ਹੈ।

Source: https://dev.to/paultwist/the-agents-that-actually-ship-why-boring-beats-autonomous-49li

Optional learning community: https://t.me/GyaanSetuAi

The Agents That Actually Ship

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗜𝘀 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁. 𝗛𝗲𝗿𝗲'𝘀 𝗪𝗵𝗮𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗜𝘀.

𝗧𝗵𝗲 𝟰𝟴 𝗛𝗼𝘂𝗿 𝗥𝘂𝗹𝗲: 𝗦𝗵𝗶𝗽 𝗜𝗻𝘀𝘁𝗲𝗮𝗱 𝗢𝗳 𝗣𝗹𝗮𝗻𝗻𝗶𝗻𝗴

ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ AI ਏਜੰਟਾਂ ਨੂੰ ਚਲਾਉਣ ਵੇਲੇ ਮੈਂ ਕੀ ਸਿੱਖਿਆ

The Exact Stack I Use to Build Production AI Agents