Agentic Loops ਦਾ ਉਭਾਰ: AI Autonomy ਵਿੱਚ ਅਗਲੀ ਸੀਮਾ

ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਦਾ ਵਿਕਾਸ ਸਥਿਰ ਕੋਡ ਜਨਰੇਸ਼ਨ ਤੋਂ ਤੇਜ਼ੀ ਨਾਲ ਗਤੀਸ਼ੀਲ, ਸਵੈ-ਰੱਖਿਅਕ (self-sustaining) ਈਕੋਸਿਸਟਮਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ। ਜਿਵੇਂ ਕਿ ਡਿਵੈਲਪਰ ਕੋਡ ਲਿਖਣ ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ agents ਦੀ ਵਰਤੋਂ ਕਰਨ ਲੱਗੇ ਹਨ, ਉਦਯੋਗ ਹੁਣ "loops" ਦੇ ਯੁੱਗ ਵਿੱਚ ਪ੍ਰਵੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ—ਜਿੱਥੇ agents ਦੂਜੇ agents ਨੂੰ ਲਗਾਤਾਰ ਅਤੇ ਵਾਰ-ਵਾਰ (iterative) ਕੰਮ ਕਰਨ ਲਈ ਪ੍ਰੋਂਪਟ ਕਰਦੇ ਹਨ।

Source Code ਤੋਂ Agentic Swarms ਤੱਕ

Meta ਦੇ @Scale ਕਾਨਫਰੰਸ ਵਿੱਚ, Claude Code ਦੇ ਸਿਰਜਣਹਾਰ ਬੋਰਿਸ ਚਰਨੀ (Boris Cherny) ਨੇ AI ਵਿਕਾਸ ਜੀਵਨ ਚੱਕਰ (lifecycle) ਵਿੱਚ ਇੱਕ ਡੂੰਘੇ ਬਦਲਾਅ 'ਤੇ ਰੌਸ਼ਨੀ ਪਾਈ। ਜਦੋਂ ਕਿ ਪਿਛਲਾ ਵੱਡਾ ਮੀਲ ਪੱਥਰ ਮੈਨੂਅਲ source code ਤੋਂ AI-ਲਿਖੇ ਕੋਡ ਵੱਲ ਵਧਣਾ ਸੀ, ਚਰਨੀ ਦਾ ਤਰਕ ਹੈ ਕਿ ਅਗਲੀ ਛਾਲ ਵੀ ਉਨੀ ਹੀ ਮਹੱਤਵਪੂਰਨ ਹੈ: agents ਦੁਆਰਾ ਦੂਜੇ agents ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨਾ।

ਇਹ ਸਿਰਫ਼ ਸਿਧਾਂਤਕ ਨਹੀਂ ਹੈ; ਚਰਨੀ ਇੱਕ ਅਜਿਹੇ ਵਰਕਫਲੋ ਦਾ ਵਰਣਨ ਕਰਦੇ ਹਨ ਜਿੱਥੇ ਵਿਸ਼ੇਸ਼ agents ਇੱਕ ਨਿਰੰਤਰ ਚੱਕਰ ਵਿੱਚ ਕੰਮ ਕਰਦੇ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ agent ਸਿਰਫ਼ ਕੋਡ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਧਾਰਨ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਸਕਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਦੂਜਾ ਇੱਕਜੁੱਟ ਕਰਨ ਲਈ ਡੁਪਲੀਕੇਟ ਅਬਸਟਰੈਕਸ਼ਨਾਂ (abstractions) ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ। ਇਹ agents ਮਨੁੱਖੀ ਇੰਜੀਨੀਅਰਾਂ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ, pull requests ਸਬਮਿਟ ਕਰਦੇ ਹਨ ਅਤੇ ਅਸਿੰਕਰੋਣਤ (asynchronously) ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ। ਰਵਾਇਤੀ ਆਟੋਮੇਸ਼ਨ ਦੇ ਉਲਟ, ਇਹ loops non-deterministic ਹੁੰਦੇ ਹਨ; ਕਿਸੇ hard-coded exit condition ਦੀ ਪਾਲਣਾ ਕਰਨ ਦੀ ਬਜਾਏ, ਇੱਕ sub-agent ਇਹ ਫੈਸਲਾ ਲੈਣ ਲਈ ਤਰਕ (reasoning) ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਕਿ ਕਦੋਂ ਕੋਡ ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਆਪਟੀਮਾਈਜ਼ਡ ਜਾਂ ਪੂਰਾ ਹੋ ਗਿਆ ਹੈ।

Loop Logic ਅਤੇ Test-Time Compute ਨੂੰ ਸਮਝਣਾ

"loops" ਦਾ ਸੰਕਲਪ ਮੂਲ ਕੰਪਿਊਟਰ ਸਾਇੰਸ—ਖਾਸ ਕਰਕੇ recursive functions—ਤੋਂ ਲਿਆ ਗਿਆ ਹੈ—ਪਰ ਇਹ ਸੰਭਾਵਨਾਤਮਕ ਤਰਕ (probabilistic reasoning) ਦੀ ਇੱਕ ਪਰਤ ਜੋੜਦਾ ਹੈ। ਇੱਕ ਪ੍ਰਮੁੱਖ ਪੈਟਰਨ "Ralph Loop" ਹੈ (ਜੋ Simpsons ਦੇ ਪਾਤਰ Ralph Wiggum ਦੇ ਨਾਮ 'ਤੇ ਰੱਖਿਆ ਗਿਆ ਹੈ), ਜੋ ਲੰਬੇ ਕੰਮਾਂ ਦੌਰਾਨ ਮਾਡਲਾਂ ਨੂੰ ਭਟਕਣ ਤੋਂ ਰੋਕਣ ਲਈ ਵਰਤੀ ਜਾਣ ਵਾਲੀ ਇੱਕ ਤਕਨੀਕ ਹੈ। ਮਾਡਲ ਆਪਣੀ ਪ੍ਰਗਤੀ ਦਾ ਸਾਰ (summary) ਕੱਢਦਾ ਹੈ ਅਤੇ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਉਸਨੇ ਆਪਣੇ ਟੀਚੇ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰ ਲਿਆ ਹੈ, ਜੋ ਅਸਲ ਵਿੱਚ ਇੱਕ ਸਫਲ ਨਤੀਜੇ ਤੱਕ ਪਹੁੰਚਣ ਤੱਕ ਤਰਕ ਨੂੰ ਆਉਂਦੇ-ਜਾਂਦੇ (bouncing) ਰੱਖਦਾ ਹੈ।

ਇਹ ਰੁਝਾਨ "test-time compute" ਦੇ ਸੰਕਲਪ ਨਾਲ ਨੇੜਿਓਂ ਜੁੜਿਆ ਹੋਇਆ ਹੈ। ਜਿਵੇਂ ਕਿ OpenAI ਖੋਜਕਰਤਾ Noam Brown ਨੇ ਨੋਟ ਕੀਤਾ ਹੈ, ਜੇਕਰ ਲੋੜੀਂਦੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤ ਪ੍ਰਦਾਨ ਕੀਤੇ ਜਾਣ ਤਾਂ ਆਧੁਨਿਕ ਮਾਡਲ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰ ਸਕਦੇ ਹਨ। "hill-climbing" ਸਥਿਤੀਆਂ ਵਿੱਚ—ਜਿਵੇਂ ਕਿ codebase ਵਿੱਚ ਹੌਲੀ-ਹੌਲੀ ਸੁਧਾਰ ਕਰਨਾ—loops ਇੱਕ AI ਨੂੰ ਕਿਸੇ ਸਮੱਸਿਆ 'ਤੇ ਲਗਾਤਾਰ ਕੰਮ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ, ਇੱਕ ਖਾਸ ਸੀਮਾ (threshold) ਤੱਕ ਪਹੁੰਚਣ ਤੱਕ ਉੱਚ ਪੱਧਰੀ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵਧੇਰੇ compute ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।

ਆਰਥਿਕ ਅਸਲੀਅਤ: Token Consumption ਬਨਾਮ Value

ਹਾਲਾਂਕਿ agentic loops ਦੀ ਤਕਨੀਕੀ ਸੰਭਾਵਨਾ ਹੈਰਾਨ ਕਰਨ ਵਾਲੀ ਹੈ, ਪਰ ਇਸਦੇ ਆਰਥਿਕ ਪ੍ਰਭਾਵ ਮਹੱਤਵਪੂਰਨ ਹਨ। ਇੱਕ ਸਟੈਂਡਰਡ Q&A chatbot ਇੰਟਰੈਕਸ਼ਨ ਦੇ ਉਲਟ, agentic loops ਪਿਛੋਕੜ (background) ਵਿੱਚ ਲਗਾਤਾਰ ਚੱਲਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਇਹ token consumption ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਉਛਾਲ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜੋ ਉਦਯੋਗਾਂ (enterprises) ਲਈ ਲਾਗਤਾਂ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਧਾ ਸਕਦਾ ਹੈ।

Anthropic ਵਰਗੇ AI ਪ੍ਰਦਾਤਾਵਾਂ ਲਈ, ਇਹ ਉੱਚ-ਵਿਕਾਸ ਵਾਲਾ ਮਾਲੀਆ ਮਾਡਲ (revenue model) ਹੈ। ਹਾਲਾਂਕਿ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਸਥਾਪਕਾਂ (founders) ਲਈ, loops ਨੂੰ ਲਾਗੂ ਕਰਨ ਲਈ ਇੱਕ ਸੂਖਮ ਸੰਤੁਲਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਨਵੇਂ ਖੇਤਰ ਵਿੱਚ ਸਫਲਤਾ "drift" (ਜਿੱਥੇ AI ਆਪਣੇ ਅਸਲ ਟੀਚੇ ਤੋਂ ਭਟਕ ਜਾਂਦਾ ਹੈ) ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਸਖ਼ਤ ਨਿਗਰਾਨੀ ਰੱਖਣ ਅਤੇ token ਖਰਚੇ 'ਤੇ ਸਖ਼ਤ guardrails ਸਥਾਪਤ ਕਰਨ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ ਤਾਂ ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕੇ ਕਿ loop ਦੁਆਰਾ ਪੈਦਾ ਕੀਤੀ ਗਈ value ਇਸਦੀ ਸੰਚਾਲਨ ਲਾਗਤ (operational cost) ਨਾਲੋਂ ਵੱਧ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ (Key Takeaways)

  • Autonomy ਵਿੱਚ ਬਦਲਾਅ: AI ਸਿੰਗਲ-ਟਰਨ ਕੋਡ ਜਨਰੇਸ਼ਨ ਤੋਂ ਖੁਦਮੁਖਤਿਆਰ (autonomous) agentic loops ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ ਜਿੱਥੇ agents ਇੱਕ ਦੂਜੇ ਦੀ ਨਿਗਰਾਨੀ ਕਰਦੇ ਹਨ ਅਤੇ ਪ੍ਰੋਂਪਟ ਕਰਦੇ ਹਨ।
  • Test-Time Compute: Agentic loops ਗੁੰਝਲਦਾਰ, ਵਾਰ-ਵਾਰ ਹੋਣ ਵਾਲੀਆਂ "hill-climbing" ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ inference ਪੜਾਅ ਦੌਰਾਨ ਵਧੇਰੇ compute ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।
  • ਲਾਗਤ ਪ੍ਰਬੰਧਨ ਮਹੱਤਵਪੂਰਨ ਹੈ: ਇਹਨਾਂ loops ਦੀ ਨਿਰੰਤਰ ਪ੍ਰਕਿਰਤੀ token consumption ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਵਧਾ ਸਕਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਉਦਯੋਗਾਂ ਦੁਆਰਾ ਅਪਣਾਏ ਜਾਣ ਲਈ ਨਿਗਰਾਨੀ ਅਤੇ ਬਜਟ guardrails ਜ਼ਰੂਰੀ ਹੋ ਜਾਂਦੇ ਹਨ।