عاملهای هوش مصنوعی چیستند؟
یک بار از ChatGPT خواستم برای سفر به استانبول برنامهریزی کند. برنامه بسیار خوبی به من داد. اما نمیتوانست پروازها را رزرو کند. نمیتوانست قیمت هتلها را چک کند. نمیتوانست ایمیل ارسال کند.
مدل باهوش بود، اما دست نداشت. میتوانست فکر کند، اما نمیتوانست عمل کند.
عاملهای هوش مصنوعی (AI agents) این مشکل را حل میکنند.
مدلهای زبانی بزرگ استاندارد (LLMs) مانند یک دستیار مطالعهکرده عمل میکنند. شما یک دستور (prompt) میفرستید و مدل یک پاسخ میدهد. این یک رفت و برگشتِ واحد است. مدل در وب جستجو نمیکند، تقویم شما را چک نمیکند و در دنیای واقعی اقدامی انجام نمیدهد.
یک عامل هوش مصنوعی (AI agent) متفاوت است. یک عامل از یک مدل زبانی استفاده میکند تا تصمیم بگیرد چگونه از ابزارها برای رسیدن به یک هدف استفاده کند.
یک عامل میتواند:
- در وب جستجو کند
- کد اجرا کند
- از یک پایگاه داده پرسوجو کند
- ایمیل ارسال کند
- از APIهای خارجی استفاده کند
تفاوت اصلی در خودمختاری (autonomy) است. شما به یک عامل یک هدف میدهید و او مراحل را خودش پیدا میکند.
مقایسه: • LLM معمولی: پاسخ به سوالات، پاسخ تکمرحلهای، بدون ابزار، واکنشی (reactive). • AI Agent: انجام اقدام، استدلال چندمرحلهای، استفاده از ابزارها، هدفمحور.
بیشتر عاملها از الگویی به نام ReAct (استدلال و عمل) استفاده میکنند. این الگو یک حلقه ساده را دنبال میکند:
- Thought (فکر): مرحله بعدی باید چه کار کنم؟
- Action (عمل): استفاده از یک ابزار.
- Observe (مشاهده): نگاه کردن به نتیجه.
- Repeat (تکرار): ادامه دادن تا زمانی که هدف محقق شود.
ساختن این حلقهها دشوار است. شما باید خطاها را مدیریت کنید، حافظه را کنترل کنید و ابزارها را به هم متصل کنید.
به همین دلیل است که فریمورکهایی مانند LangChain وجود دارند. LangChain زیرساختهای لازم را فراهم میکند. این فریمورک ابزارهای از پیش ساخته شده، حافظه و روشهایی برای اتصال مدلها به دنیای واقعی را در اختیار شما قرار میدهد.
اگر گردش کار (workflow) شما پیچیده است، از LangGraph استفاده میکنید. LangGraph به شما کمک میکند عاملهایی بسازید که میتوانند به مسیرهای مختلف شاخه بزنند، وظایف را به صورت موازی اجرا کنند یا به مراحل قبلی بازگردند.
خلاصه:
- LLMها به متن پاسخ میدهند.
- عاملها از ابزارها برای تکمیل وظایف استفاده میکنند.
- حلقه ReAct منطق عامل را هدایت میکند.
- LangChain مدیریت اتصال بین مدلها و ابزارها را بر عهده دارد.
- LangGraph گردشهای کاری پیچیده و شاخهبندی شده را مدیریت میکند.
در پست بعدی، به شما نشان خواهم داد که چگونه محیط خود را آماده کرده و اولین عامل خود را اجرا کنید.
Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd
Optional learning community: https://t.me/GyaanSetuAi