اے آئی ایجنٹس (AI Agents) کیا ہیں؟

میں نے ایک بار ChatGPT سے استنبول کے سفر کا منصوبہ بنانے کو کہا۔ اس نے مجھے ایک بہترین منصوبہ بنا کر دیا۔ لیکن وہ پروازیں بک نہیں کر سکا۔ وہ ہوٹلوں کی قیمتیں چیک نہیں کر سکا۔ وہ ای میل نہیں بھیج سکا۔

ماڈل ذہین تھا، لیکن اس کے ہاتھ نہیں تھے۔ وہ سوچ سکتا تھا، لیکن عمل نہیں کر سکتا تھا۔

AI ایجنٹس اس مسئلے کو حل کرتے ہیں۔

عام LLMs (Large Language Models) ایک پڑھے لکھے اسسٹنٹ کی طرح کام کرتے ہیں۔ آپ ایک پرامپٹ (prompt) بھیجتے ہیں، اور ماڈل جواب دیتا ہے۔ یہ ایک ہی بار کا تبادلہ ہے۔ ماڈل ویب براؤز نہیں کرتا، آپ کا کیلنڈر چیک نہیں کرتا، یا حقیقی دنیا میں کوئی عمل نہیں کرتا۔

ایک AI ایجنٹ مختلف ہوتا ہے۔ ایک ایجنٹ کسی مقصد تک پہنچنے کے لیے ٹولز (tools) کے استعمال کا فیصلہ کرنے کے لیے لینگویج ماڈل کا استعمال کرتا ہے۔

ایک ایجنٹ کر سکتا ہے:

  • ویب پر سرچ کرنا
  • کوڈ چلانا
  • ڈیٹا بیس سے معلومات حاصل کرنا
  • ای میلز بھیجنا
  • بیرونی APIs کا استعمال کرنا

بنیادی فرق خود مختاری (autonomy) کا ہے۔ آپ ایجنٹ کو ایک مقصد دیتے ہیں، اور وہ خود اس کے مراحل طے کرتا ہے۔

موازنہ: • عام LLM: سوالات کے جواب دیتا ہے، ایک ہی جواب، کوئی ٹولز نہیں، ردِعمل دینے والا (reactive)۔ • AI Agent: عمل کرتا ہے، کثیر مرحلہ وار استدلال (multi-step reasoning)، ٹولز کا استعمال کرتا ہے، مقصد پر مبنی (goal-driven)۔

زیادہ تر ایجنٹس ReAct (Reason and Act) نامی پیٹرن استعمال کرتے ہیں۔ یہ ایک سادہ لوپ (loop) پر عمل کرتا ہے:

  1. سوچ (Thought): مجھے آگے کیا کرنے کی ضرورت ہے؟
  2. عمل (Action): ایک ٹول استعمال کریں۔
  3. مشاہدہ (Observe): نتیجے کو دیکھیں۔
  4. دہرائیں (Repeat): مقصد حاصل ہونے تک جاری رکھیں۔

ان لوپس کو بنانا مشکل ہے۔ آپ کو غلطیوں (errors) کو سنبھالنا، میموری (memory) کا انتظام کرنا اور ٹولز کو جوڑنا پڑتا ہے۔

یہی وجہ ہے کہ LangChain جیسے فریم ورکس موجود ہیں۔ LangChain بنیادی ڈھانچہ (plumbing) فراہم کرتا ہے۔ یہ آپ کو پہلے سے بنے ہوئے ٹولز، میموری، اور ماڈلز کو حقیقی دنیا سے جوڑنے کے طریقے فراہم کرتا ہے۔

اگر آپ کا ورک فلو پیچیدہ ہے، تو آپ LangGraph استعمال کرتے ہیں۔ LangGraph آپ کو ایسے ایجنٹس بنانے میں مدد دیتا ہے جو مختلف راستوں پر تقسیم ہو سکتے ہیں، کاموں کو متوازی (parallel) چلا سکتے ہیں، یا پچھلے مراحل پر واپس جا سکتے ہیں۔

خلاصہ:

  • LLMs ٹیکسٹ کا جواب دیتے ہیں۔
  • ایجنٹس کام مکمل کرنے کے لیے ٹولز استعمال کرتے ہیں۔
  • ReAct لوپ ایجنٹ کی منطق (logic) کو چلاتا ہے۔
  • LangChain ماڈلز اور ٹولز کے درمیان تعلق کو منظم کرتا ہے۔
  • LangGraph پیچیدہ اور شاخ دار ورک فلو کو سنبھالتا ہے۔

اپنی اگلی پوسٹ میں، میں آپ کو دکھاؤں گا کہ اپنا ماحول (environment) کیسے سیٹ اپ کریں اور اپنا پہلا ایجنٹ کیسے چلائیں۔

Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd

Optional learning community: https://t.me/GyaanSetuAi