ИИ пишет код. Но он не может определить, что значит «готово».

Я создал генератор презентаций на базе ИИ. Вы вводите тему и получаете презентацию.

Демо-версия ИИ сработала мгновенно. Он составил план. Создал слайды. Экспортировал файл. На моем экране всё выглядело готовым.

Но это не было завершенным продуктом.

ИИ доказал, что один пользователь может создать одну презентацию один раз. Настоящий продукт — это другое. Он должен обслуживать 100 пользователей одновременно. Он должен правильно выставлять счета. Он должен восстанавливаться при сбое на каком-либо этапе. Он должен экспортировать файл, который действительно открывается в PowerPoint.

ИИ не добавил эти функции, потому что я его об этом не просил.

Когда вы создаете что-то с помощью ИИ, самая сложная часть — не описание функции. Самое сложное — определить, что именно означает «готово».

В качестве основы я использовал Velobase Harness. Он взял на себя аутентификацию, платежи, систему кредитов и базы данных. Это позволило мне сфокусировать ИИ непосредственно на генерации PPT.

Именно здесь возник разрыв между «выглядит готовым» и «является готовым». Я обнаружил четыре основных пробела:

  • Конкурентность (Concurrency): ИИ считает, что один успешный запуск равен готовой функции. Реальной системе нужно разделять задачи на очереди. Каждый слайд должен генерироваться как отдельная задача, чтобы воркеры могли масштабироваться.

  • Биллинг: ИИ спишет кредиты один раз и остановится. Настоящему продукту нужен конечный автомат (state machine). Вы должны резервировать кредиты, проводить расчет на основе фактического использования и возвращать средства в случае сбоя.

  • Самопроверка: Если бэкенд молча повторяет задачу, пользователь видит лишь крутящийся индикатор загрузки. Вы должны показывать статус. Пользователь должен видеть «проверка» или «перерисовка», чтобы понимать, что система работает.

  • Экспорт: Слайд может отлично выглядеть в браузере, но «поехать» в файле PPTX. Требование заключается не просто в создании файла. Требование в том, чтобы файл соответствовал веб-превью.

Я изменил свои инструкции. Я перестал давать ИИ список функций. Я начал давать ему критерии приемки (acceptance criteria).

Мои новые правила для ИИ:

  • Создавай production-ready SaaS, а не демо-версию.
  • Поддерживай 100 одновременных пользователей.
  • Используй независимые очереди для планирования и создания слайдов.
  • Подключай каждый вызов модели к системе биллинга.
  • Ставь задачи на паузу и возобновляй их в зависимости от баланса кредитов.
  • Выполняй проверку верстки после каждого слайда.
  • Обеспечь соответствие экспорта PPTX визуальному превью.
  • Пиши тесты на конкурентность и обработку ошибок, а не только на успешные сценарии.

ИИ пишет код быстро. Он просто не знает, что делает код готовым к релизу. Он воспринимает локальное демо как полноценную систему.

Роль человека заключается в определении инженерных границ, сценариев отказа и бизнес-правил.

Harness обеспечивает SaaS-фундамент. ИИ реализует логику. Вам остается лишь предоставлять максимально точные вводные данные.

Если вы выпустили продукт, созданный с помощью ИИ, в чем заключался самый сложный разрыв между «оно работает» и «оно готово к клиентам»?

Источник: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6