چطور یک سوپر-اپلیکیشن شخصی هوش مصنوعی ساختم

من ماه‌ها مثل بقیه از Codex استفاده می‌کردم. از یک ترمینال و یک جلسه خروجی طولانی استفاده می‌کردم. سپس codex app-server را پیدا کردم. این موتور، Codex را به صورت JSON-RPC از طریق stdio ارائه می‌دهد.

این کشف ایده‌ای به ذهنم داد. می‌توانستم رابط کاربری مخصوص به خودم را برای کارهای خاص خودم بسازم.

OpenAI می‌گوید یک سوپر-اپلیکیشن (super-app) واقعی هوش مصنوعی، مکانی است که در آن عامل‌ها (agents)، ابزارها و تاریخچه در کنار هم قرار دارند. شما نباید مدام بین چت، ترمینال و مرورگر جابه‌جا شوید. همه چیز باید در یک سطح اتفاق بیفتد.

من یک اپلیکیشن دسکتاپ ساختم که Codex را در بر می‌گیرد (wraps). این اپلیکیشن چندین کار انجام می‌دهد:

  • اجرای همزمان چندین جلسه عامل (agent session) در یک شبکه (grid).
  • بهبود پرامپت‌های من پیش از آنکه عامل آن‌ها را ببیند.
  • توضیح خروجی عامل به زبان ساده.
  • ایجاد زیر-عامل‌ها (sub-agents) تنها با یک کلیک.

من برای ساخت یک محصول برنامه‌ریزی نکردم؛ بلکه ناکامی‌های خودم را خودکارسازی کردم. هر بار یک مشکل را حل کردم تا اینکه این رابط (wrapper) به فضای کاری اصلی من تبدیل شد.

شما هم می‌توانید این کار را انجام دهید. بیشتر مردم از Codex به عنوان یک چت در ترمینال استفاده می‌کنند. اما فایل باینری شامل یک حالت مخفی است: codex app-server. این حالت، CLI را به یک سرور تبدیل می‌کند.

برای ساختن چیزی واقعی، فقط به چند دستور نیاز دارید:

  • thread/start: باز کردن یک جلسه.
  • turn/start: دادن کار به آن.
  • turn/steer: ارسال پیام به یک چرخه (turn) در حال اجرا.

هدف اصلی من ساده بود. دکمه‌ای می‌خواستم که یک نمونه (instance) تازه از Codex ایجاد کند. این نمونه جدید، کانتکست (context) فعلی من را به ارث می‌برد. این‌گونه می‌تواند یک ایده موازی را دنبال کند، در حالی که جلسه اصلی من متمرکز باقی می‌ماند.

من به زیر-عامل یک گزارش اجمالی (briefing) می‌دهم. این گزارش شامل نام پروژه، دایرکتوری کاری و تصویری (snapshot) از خط زمانی (timeline) والد است. همچنین به زیر-عامل می‌گویم که یک جلسه والد همچنان در حال کار در مخزن (repository) است. این کار مانع از آن می‌شود که زیر-عامل باعث خرابی سیستم شود.

این اپلیکیشن از یک خط زمانی (timeline) به عنوان منبع اصلی حقیقت (source of truth) استفاده می‌کند. هر پیام، دستور و تغییر فایل، به یک رویداد در این خط زمانی تبدیل می‌شود. این ویژگی اجازه می‌دهد تا قابلیت‌های مختلف از داده‌های یکسانی استفاده کنند.

من همچنین یک لایه ترجمه اضافه کردم. Codex کد را اجرا می‌کند، اما Claude نتایج را ترجمه می‌کند. Claude ایده‌های نامنظم من را به پرامپت‌های دقیق تبدیل می‌کند. همچنین لاگ‌های خام Codex را به توضیحات ساده تبدیل می‌کند.

یک مدل اجرا می‌کند و مدل دیگر ترجمه می‌کند. این رابط (wrapper) حلقه را حفظ می‌کند.

اگر می‌خواهید نسخه خودتان را بسازید، این مراحل را دنبال کنید:

  • با یک مشکل یا اصطکاک در جریان کاری خود شروع کنید.
  • codex app-server را اجرا کنید.
  • از طریق JSON-RPC با آن صحبت کنید.
  • یک اقدام تکراری را انتخاب کرده و آن را به یک دکمه تبدیل کنید.

یک سوپر-اپلیکیشن لزوماً نباید عظیم‌الجثه باشد. می‌تواند ابزار کوچکی باشد که مشکلی را که دیروز داشتید حل می‌کند.

منبع: https://dev.to/cloudx/how-i-built-a-personal-ai-super-app-by-wrapping-codex-app-server-5fp6

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi