𝗪𝗵𝗮𝘁 𝗔𝗿𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀?
ਮੈਂ ਇੱਕ ਵਾਰ ChatGPT ਨੂੰ ਇੰਸਟਾਂਬੁਲ ਦੀ ਯਾਤਰਾ ਦੀ ਯੋਜਨਾ ਬਣਾਉਣ ਲਈ ਕਿਹਾ ਸੀ। ਇਸਨੇ ਮੈਨੂੰ ਇੱਕ ਵਧੀਆ ਯੋਜਨਾ ਦਿੱਤੀ। ਪਰ ਇਹ ਫਲਾਈਟਾਂ ਬੁੱਕ ਨਹੀਂ ਕਰ ਸਕਿਆ। ਇਹ ਹੋਟਲ ਦੀਆਂ ਕੀਮਤਾਂ ਨਹੀਂ ਚੈੱਕ ਕਰ ਸਕਿਆ। ਇਹ ਈਮੇਲ ਨਹੀਂ ਭੇਜ ਸਕਿਆ।
ਮਾਡਲ ਸਮਾਰਟ ਸੀ, ਪਰ ਇਸਦੇ ਕੋਲ ਹੱਥ ਨਹੀਂ ਸਨ। ਇਹ ਸੋਚ ਸਕਦਾ ਸੀ, ਪਰ ਇਹ ਕੰਮ ਨਹੀਂ ਕਰ ਸਕਦਾ ਸੀ।
AI agents ਇਸ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਦੇ ਹਨ।
Standard LLMs (Large Language Models) ਇੱਕ ਪੜ੍ਹੇ-ਲਿਖੇ ਸਹਾਇਕ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ। ਤੁਸੀਂ ਇੱਕ prompt ਭੇਜਦੇ ਹੋ, ਅਤੇ ਮਾਡਲ ਇੱਕ ਜਵਾਬ ਭੇਜਦਾ ਹੈ। ਇਹ ਇੱਕ ਸਿੰਗਲ ਰੌਂਡ ਟ੍ਰਿਪ (round trip) ਹੈ। ਮਾਡਲ ਵੈੱਬ ਸਰਚ ਨਹੀਂ ਕਰਦਾ, ਤੁਹਾਡਾ ਕੈਲੰਡਰ ਚੈੱਕ ਨਹੀਂ ਕਰਦਾ, ਜਾਂ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਕੋਈ ਕਾਰਵਾਈ ਨਹੀਂ ਕਰਦਾ।
ਇੱਕ AI agent ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ। ਇੱਕ agent ਕਿਸੇ ਟੀਚੇ (goal) ਤੱਕ ਪਹੁੰਚਣ ਲਈ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕਰਨੀ ਹੈ, ਇਹ ਫੈਸਲਾ ਕਰਨ ਲਈ ਇੱਕ language model ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
ਇੱਕ agent ਕਰ ਸਕਦਾ ਹੈ:
- ਵੈੱਬ ਸਰਚ ਕਰਨਾ
- ਕੋਡ ਚਲਾਉਣਾ
- ਡਾਟਾਬੇਸ ਵਿੱਚ ਕੁਐਰੀ (query) ਕਰਨਾ
- ਈਮੇਲ ਭੇਜਣਾ
- ਬਾਹਰੀ APIs ਦੀ ਵਰਤੋਂ ਕਰਨਾ
ਮੁੱਖ ਅੰਤਰ autonomy ਹੈ। ਤੁਸੀਂ ਇੱਕ agent ਨੂੰ ਇੱਕ ਟੀਚਾ ਦਿੰਦੇ ਹੋ, ਅਤੇ ਉਹ ਕਦਮਾਂ ਦਾ ਪਤਾ ਲਗਾ ਲੈਂਦਾ ਹੈ।
Comparison: • Regular LLM: ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ, ਸਿੰਗਲ ਰਿਸਪਾਂਸ, ਕੋਈ ਟੂਲ ਨਹੀਂ, reactive. • AI Agent: ਕਾਰਵਾਈ ਕਰਦਾ ਹੈ, multi-step reasoning, ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, goal-driven.
ਜ਼ਿਆਦਾਤਰ agents ReAct (Reason and Act) ਨਾਮਕ ਇੱਕ ਪੈਟਰਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਸਧਾਰਨ ਲੂਪ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ:
- Thought: ਮੈਨੂੰ ਅੱਗੇ ਕੀ ਕਰਨ ਦੀ ਲੋੜ ਹੈ?
- Action: ਇੱਕ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰੋ।
- Observe: ਨਤੀਜੇ ਨੂੰ ਦੇਖੋ।
- Repeat: ਟੀਚਾ ਪੂਰਾ ਹੋਣ ਤੱਕ ਜਾਰੀ ਰੱਖੋ।
ਇਹਨਾਂ ਲੂਪਸ ਨੂੰ ਬਣਾਉਣਾ ਮੁਸ਼ਕਲ ਹੈ। ਤੁਹਾਨੂੰ ਗਲਤੀਆਂ (errors) ਨੂੰ ਸੰਭਾਲਣਾ, ਮੈਮੋਰੀ ਦਾ ਪ੍ਰਬੰਧ ਕਰਨਾ, ਅਤੇ ਟੂਲਸ ਨੂੰ ਜੋੜਨਾ ਪਵੇਗਾ।
ਇਸੇ ਲਈ LangChain ਵਰਗੇ frameworks ਮੌਜੂਦ ਹਨ। LangChain ਬੁਨਿਆਦੀ ਢਾਂਚਾ (plumbing) ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਤੁਹਾਨੂੰ pre-built tools, memory, ਅਤੇ ਮਾਡਲਾਂ ਨੂੰ ਅਸਲ ਦੁਨੀਆ ਨਾਲ ਜੋੜਨ ਦੇ ਤਰੀਕੇ ਦਿੰਦਾ ਹੈ।
ਜੇਕਰ ਤੁਹਾਡਾ workflow ਗੁੰਝਲਦਾਰ ਹੈ, ਤਾਂ ਤੁਸੀਂ LangGraph ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ। LangGraph ਤੁਹਾਨੂੰ ਅਜਿਹੇ agents ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਰਸਤਿਆਂ ਵਿੱਚ ਵੰਡ ਸਕਦੇ ਹਨ, ਕੰਮਾਂ ਨੂੰ parallel ਚਲਾ ਸਕਦੇ ਹਨ, ਜਾਂ ਪਿਛਲੇ ਕਦਮਾਂ 'ਤੇ ਵਾਪਸ ਜਾ ਸਕਦੇ ਹਨ।
Summary:
- LLMs ਟੈਕਸਟ ਦਾ ਜਵਾਬ ਦਿੰਦੇ ਹਨ।
- Agents ਕੰਮ ਪੂਰੇ ਕਰਨ ਲਈ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।
- ReAct ਲੂਪ agent logic ਨੂੰ ਚਲਾਉਂਦਾ ਹੈ।
- LangChain ਮਾਡਲਾਂ ਅਤੇ ਟੂਲਸ ਵਿਚਕਾਰ ਸੰਪਰਕ ਦਾ ਪ੍ਰਬੰਧ ਕਰਦਾ ਹੈ।
- LangGraph ਗੁੰਝਲਦਾਰ, branching workflows ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ।
ਆਪਣੀ ਅਗਲੀ ਪੋਸਟ ਵਿੱਚ, ਮੈਂ ਤੁਹਾਨੂੰ ਦਿਖਾਵਾਂਗਾ ਕਿ ਆਪਣਾ environment ਕਿਵੇਂ ਸੈੱਟ ਕਰਨਾ ਹੈ ਅਤੇ ਆਪਣਾ ਪਹਿਲਾ agent ਕਿਵੇਂ ਚਲਾਉਣਾ ਹੈ।
Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd
Optional learning community: https://t.me/GyaanSetuAi