معماری پنهان پشت AI SaaS
ساخت یک پلتفرم AI SaaS یک چیز به من آموخت.
بخش سخت کار، فراخوانی یک LLM نیست. بخش سخت، به کار گرفتن هوش مصنوعی در یک کسبوکار واقعی است.
در ابتدا، همه چیز ساده به نظر میرسد. با خود فکر میکنید:
- کلیدهای API فقط چند عبارت مخفی (secrets) هستند.
- SSO فقط یک اتصال ساده است.
- Billing (صورتحساب) فقط استفاده از Stripe است.
- Deployment (استقرار) فقط Docker است.
- AI فقط یک فراخوانی OpenAI است.
سپس پلتفرم واقعی میشود. هر موضوع سادهای به یک سیستم پیچیده تبدیل میشود.
API Keys یک کلید API فقط یک رشته (string) نیست. در SaaS سازمانی، یک کلید باید موارد زیر را مدیریت کند:
- Scopes (محدودههای دسترسی) و انقضا.
- Revocation (ابطال) و گزارشهای بازرسی (audit logs).
- مرزهای Tenant (مستأجر) و محدودیتهای نرخ درخواست (rate limits).
- دسترسی مبتنی بر طرح (plan-based access).
یک کلید باید پاسخ دهد که مالک آن کیست، به کدام Tenant تعلق دارد و به چه چیزهایی میتواند دسترسی داشته باشد.
SSO and Identity متصل کردن یک ارائهدهنده آسان است. بخش سخت، تصمیمگیری درباره این است که به چه چیزی اعتماد کنیم.
- آیا به دامنه ایمیل اعتماد میکنید یا گروهها؟
- آیا یک مدیر Tenant میتواند یک مدیر پلتفرم ایجاد کند؟
- اگر کاربری به چندین Tenant تعلق داشته باشد چه اتفاقی میافتد؟
یک SSO واقعی نیازمند اعتبارسنجی صادرکننده (issuer validation)، نقشگذاری (role mapping) و جداسازی نشستها (session isolation) است.
Operating AI فراخوانی یک مدل آسان است. مدیریت عملیاتی هوش مصنوعی سخت است. شما باید موارد زیر را ردیابی کنید:
- میزان مصرف توکن و هزینه.
- میزان استفاده از ارائهدهنده و تأخیر (latency).
- تلاشهای مجدد (retries)، زمانهای انتظار (timeouts) و جایگزینها (fallbacks).
- حاکمیت پرامپت (prompt governance) و مرزهای داده.
یک نسخه دموی ساده فقط به یک پاسخ نیاز دارد. اما یک پلتفرم تجاری باید بداند کدام Tenant از کدام مدل استفاده کرده و دقیقاً چقدر هزینه داشته است.
Billing and Governance Stripe پرداختها را پردازش میکند، اما محصول شما را تعریف نمیکند. یک SaaS جدی، Billing را به موارد زیر متصل میکند:
- سهمیهها (quotas) و محدودیتهای ویژگی (feature gates).
- محدودیتهای Tenant و وضعیت اشتراک.
- حالتهای استقرار مانند on-prem یا ابر مشتری.
Billing به حاکمیت تجاری تبدیل میشود. این بخش کنترل میکند که مشتری مجاز به استفاده از چه چیزهایی است.
Execution and Scaling Kubernetes شما را مقیاسپذیر نمیکند. شما باید با جداسازی موارد زیر، حجم کاری (workloads) را مدیریت کنید:
- صفها (queues) و کارگرها (workers).
- محدودیتهای منابع و مقیاسپذیری خودکار (autoscaling).
- سیاستهای شبکه و قابلیت مشاهدهپذیری (observability).
شما باید بدانید کدام کارگر در حال شکست خوردن است و کدام Tenant بیشترین بار را ایجاد میکند.
Observability مانیتورینگ یک امتیاز اضافی نیست؛ بلکه بخشی از محصول است.
- مهندسان باید بدانند چه چیزی خراب شده است.
- مدیران باید بدانند ارزش در کجا ایجاد میشود و هزینهها در کجا افزایش مییابد.
بزرگترین درس: این سیستمها به هم متصل هستند. اگر هوش مصنوعی فاقد سیستم اندازهگیری (metering) باشد، گران میشود. اگر SSO فاقد جداسازی باشد، خطرناک میشود. اگر Billing فاقد اعمال قوانین (enforcement) باشد، صرفاً ظاهری خواهد بود.
سختترین بخش ساخت AI SaaS، نوشتن پرامپت نیست؛ بلکه هماهنگ کردن هویت، دادهها، هزینهها و زیرساختها با یکدیگر است.
Optional learning community: https://t.me/GyaanSetuAi
