معماری پنهان پشت AI SaaS

ساخت یک پلتفرم AI SaaS یک چیز به من آموخت.

بخش سخت کار، فراخوانی یک LLM نیست. بخش سخت، به کار گرفتن هوش مصنوعی در یک کسب‌وکار واقعی است.

در ابتدا، همه چیز ساده به نظر می‌رسد. با خود فکر می‌کنید:

  • کلیدهای API فقط چند عبارت مخفی (secrets) هستند.
  • SSO فقط یک اتصال ساده است.
  • Billing (صورت‌حساب) فقط استفاده از Stripe است.
  • Deployment (استقرار) فقط Docker است.
  • AI فقط یک فراخوانی OpenAI است.

سپس پلتفرم واقعی می‌شود. هر موضوع ساده‌ای به یک سیستم پیچیده تبدیل می‌شود.

API Keys یک کلید API فقط یک رشته (string) نیست. در SaaS سازمانی، یک کلید باید موارد زیر را مدیریت کند:

  • Scopes (محدوده‌های دسترسی) و انقضا.
  • Revocation (ابطال) و گزارش‌های بازرسی (audit logs).
  • مرزهای Tenant (مستأجر) و محدودیت‌های نرخ درخواست (rate limits).
  • دسترسی مبتنی بر طرح (plan-based access).

یک کلید باید پاسخ دهد که مالک آن کیست، به کدام Tenant تعلق دارد و به چه چیزهایی می‌تواند دسترسی داشته باشد.

SSO and Identity متصل کردن یک ارائه‌دهنده آسان است. بخش سخت، تصمیم‌گیری درباره این است که به چه چیزی اعتماد کنیم.

  • آیا به دامنه ایمیل اعتماد می‌کنید یا گروه‌ها؟
  • آیا یک مدیر Tenant می‌تواند یک مدیر پلتفرم ایجاد کند؟
  • اگر کاربری به چندین Tenant تعلق داشته باشد چه اتفاقی می‌افتد؟

یک SSO واقعی نیازمند اعتبارسنجی صادرکننده (issuer validation)، نقش‌گذاری (role mapping) و جداسازی نشست‌ها (session isolation) است.

Operating AI فراخوانی یک مدل آسان است. مدیریت عملیاتی هوش مصنوعی سخت است. شما باید موارد زیر را ردیابی کنید:

  • میزان مصرف توکن و هزینه.
  • میزان استفاده از ارائه‌دهنده و تأخیر (latency).
  • تلاش‌های مجدد (retries)، زمان‌های انتظار (timeouts) و جایگزین‌ها (fallbacks).
  • حاکمیت پرامپت (prompt governance) و مرزهای داده.

یک نسخه دموی ساده فقط به یک پاسخ نیاز دارد. اما یک پلتفرم تجاری باید بداند کدام Tenant از کدام مدل استفاده کرده و دقیقاً چقدر هزینه داشته است.

Billing and Governance Stripe پرداخت‌ها را پردازش می‌کند، اما محصول شما را تعریف نمی‌کند. یک SaaS جدی، Billing را به موارد زیر متصل می‌کند:

  • سهمیه‌ها (quotas) و محدودیت‌های ویژگی (feature gates).
  • محدودیت‌های Tenant و وضعیت اشتراک.
  • حالت‌های استقرار مانند on-prem یا ابر مشتری.

Billing به حاکمیت تجاری تبدیل می‌شود. این بخش کنترل می‌کند که مشتری مجاز به استفاده از چه چیزهایی است.

Execution and Scaling Kubernetes شما را مقیاس‌پذیر نمی‌کند. شما باید با جداسازی موارد زیر، حجم کاری (workloads) را مدیریت کنید:

  • صف‌ها (queues) و کارگرها (workers).
  • محدودیت‌های منابع و مقیاس‌پذیری خودکار (autoscaling).
  • سیاست‌های شبکه و قابلیت مشاهده‌پذیری (observability).

شما باید بدانید کدام کارگر در حال شکست خوردن است و کدام Tenant بیشترین بار را ایجاد می‌کند.

Observability مانیتورینگ یک امتیاز اضافی نیست؛ بلکه بخشی از محصول است.

  • مهندسان باید بدانند چه چیزی خراب شده است.
  • مدیران باید بدانند ارزش در کجا ایجاد می‌شود و هزینه‌ها در کجا افزایش می‌یابد.

بزرگترین درس: این سیستم‌ها به هم متصل هستند. اگر هوش مصنوعی فاقد سیستم اندازه‌گیری (metering) باشد، گران می‌شود. اگر SSO فاقد جداسازی باشد، خطرناک می‌شود. اگر Billing فاقد اعمال قوانین (enforcement) باشد، صرفاً ظاهری خواهد بود.

سخت‌ترین بخش ساخت AI SaaS، نوشتن پرامپت نیست؛ بلکه هماهنگ کردن هویت، داده‌ها، هزینه‌ها و زیرساخت‌ها با یکدیگر است.

Source: https://dev.to/tarik_haddadi_4f933f0e217/the-hidden-architecture-behind-ai-saas-lessons-from-building-an-enterprise-automation-platform-56f2

Optional learning community: https://t.me/GyaanSetuAi