عامل‌های هوش مصنوعی چیستند؟

یک بار از ChatGPT خواستم برای سفر به استانبول برنامه‌ریزی کند. برنامه بسیار خوبی به من داد. اما نمی‌توانست پروازها را رزرو کند. نمی‌توانست قیمت هتل‌ها را چک کند. نمی‌توانست ایمیل ارسال کند.

مدل باهوش بود، اما دست نداشت. می‌توانست فکر کند، اما نمی‌توانست عمل کند.

عامل‌های هوش مصنوعی (AI agents) این مشکل را حل می‌کنند.

مدل‌های زبانی بزرگ استاندارد (LLMs) مانند یک دستیار مطالعه‌کرده عمل می‌کنند. شما یک دستور (prompt) می‌فرستید و مدل یک پاسخ می‌دهد. این یک رفت و برگشتِ واحد است. مدل در وب جستجو نمی‌کند، تقویم شما را چک نمی‌کند و در دنیای واقعی اقدامی انجام نمی‌دهد.

یک عامل هوش مصنوعی (AI agent) متفاوت است. یک عامل از یک مدل زبانی استفاده می‌کند تا تصمیم بگیرد چگونه از ابزارها برای رسیدن به یک هدف استفاده کند.

یک عامل می‌تواند:

  • در وب جستجو کند
  • کد اجرا کند
  • از یک پایگاه داده پرس‌وجو کند
  • ایمیل ارسال کند
  • از APIهای خارجی استفاده کند

تفاوت اصلی در خودمختاری (autonomy) است. شما به یک عامل یک هدف می‌دهید و او مراحل را خودش پیدا می‌کند.

مقایسه: • LLM معمولی: پاسخ به سوالات، پاسخ تک‌مرحله‌ای، بدون ابزار، واکنشی (reactive). • AI Agent: انجام اقدام، استدلال چندمرحله‌ای، استفاده از ابزارها، هدف‌محور.

بیشتر عامل‌ها از الگویی به نام ReAct (استدلال و عمل) استفاده می‌کنند. این الگو یک حلقه ساده را دنبال می‌کند:

  1. Thought (فکر): مرحله بعدی باید چه کار کنم؟
  2. Action (عمل): استفاده از یک ابزار.
  3. Observe (مشاهده): نگاه کردن به نتیجه.
  4. Repeat (تکرار): ادامه دادن تا زمانی که هدف محقق شود.

ساختن این حلقه‌ها دشوار است. شما باید خطاها را مدیریت کنید، حافظه را کنترل کنید و ابزارها را به هم متصل کنید.

به همین دلیل است که فریم‌ورک‌هایی مانند LangChain وجود دارند. LangChain زیرساخت‌های لازم را فراهم می‌کند. این فریم‌ورک ابزارهای از پیش ساخته شده، حافظه و روش‌هایی برای اتصال مدل‌ها به دنیای واقعی را در اختیار شما قرار می‌دهد.

اگر گردش کار (workflow) شما پیچیده است، از LangGraph استفاده می‌کنید. LangGraph به شما کمک می‌کند عامل‌هایی بسازید که می‌توانند به مسیرهای مختلف شاخه بزنند، وظایف را به صورت موازی اجرا کنند یا به مراحل قبلی بازگردند.

خلاصه:

  • LLMها به متن پاسخ می‌دهند.
  • عامل‌ها از ابزارها برای تکمیل وظایف استفاده می‌کنند.
  • حلقه ReAct منطق عامل را هدایت می‌کند.
  • LangChain مدیریت اتصال بین مدل‌ها و ابزارها را بر عهده دارد.
  • LangGraph گردش‌های کاری پیچیده و شاخه‌بندی شده را مدیریت می‌کند.

در پست بعدی، به شما نشان خواهم داد که چگونه محیط خود را آماده کرده و اولین عامل خود را اجرا کنید.

Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd

Optional learning community: https://t.me/GyaanSetuAi