Скрытая архитектура AI SaaS

Создание AI SaaS-платформы научило меня одному.

Сложность не в том, чтобы вызвать LLM. Сложность в том, чтобы заставить ИИ работать в реальном бизнесе.

Сначала всё кажется простым. Вы думаете:

  • API-ключи — это просто секреты.
  • SSO — это просто подключение.
  • Биллинг — это просто Stripe.
  • Деплой — это просто Docker.
  • ИИ — это просто вызов OpenAI.

Затем платформа становится реальной. Каждая простая тема превращается в сложную систему.

API-ключи API-ключ — это не просто строка. В корпоративном SaaS ключ должен обеспечивать:

  • Области доступа (scopes) и срок действия.
  • Отзыв и журналы аудита.
  • Границы тенантов и ограничения частоты запросов (rate limits).
  • Доступ на основе тарифного плана.

Ключ должен отвечать на вопросы: кто им владеет, к какому тенанту он относится и к чему он имеет доступ.

SSO и идентификация Подключить провайдера легко. Сложно решить, чему доверять.

  • Доверять ли домену электронной почты или группам?
  • Может ли администратор тенанта создать администратора платформы?
  • Что произойдет, если пользователь принадлежит к нескольким тенантам?

Настоящий SSO требует валидации издателя (issuer validation), сопоставления ролей (role mapping) и изоляции сессий.

Эксплуатация ИИ Вызвать модель легко. Эксплуатировать ИИ сложно. Вам нужно отслеживать:

  • Потребление токенов и затраты.
  • Использование провайдеров и задержку (latency).
  • Повторные попытки, таймауты и резервные варианты (fallbacks).
  • Управление промптами (prompt governance) и границы данных.

Для демо-версии достаточно ответа. Бизнес-платформе нужно знать, какой тенант использовал какую модель и сколько именно это стоило.

Биллинг и управление Stripe обрабатывает платежи, но он не определяет ваш продукт. Серьезный SaaS связывает биллинг с:

  • Квотами и ограничением функций (feature gates).
  • Лимитами тенантов и статусом подписки.
  • Режимами развертывания, такими как on-prem или облако клиента.

Биллинг становится коммерческим управлением. Он контролирует то, что клиенту разрешено использовать.

Выполнение и масштабирование Kubernetes не делает вас масштабируемым автоматически. Вы должны управлять нагрузками, разделяя:

  • Очереди и воркеры (workers).
  • Лимиты ресурсов и автомасштабирование.
  • Сетевые политики и наблюдаемость (observability).

Вам нужно знать, какой воркер дает сбой и какой тенант создает наибольшую нагрузку.

Наблюдаемость Мониторинг — это не бонус. Это часть продукта.

  • Инженерам нужно знать, что именно сломалось.
  • Руководителям нужно знать, где создается ценность, а где растут затраты.

Главный урок: эти системы взаимосвязаны. Если в ИИ нет учета потребления (metering), он становится дорогим. Если в SSO нет изоляции, он становится опасным. Если биллинг не контролирует соблюдение правил (enforcement), он становится чисто косметическим.

Самое сложное в создании AI SaaS — это не промпт. Это заставить идентификацию, данные, затраты и инфраструктуру работать как единое целое.

Source: https://dev.to/tarik_haddadi_4f933f0e217/the-hidden-architecture-behind-ai-saas-lessons-from-building-an-enterprise-automation-platform-56f2

Optional learning community: https://t.me/GyaanSetuAi