У ИИ-агентов есть проблема с надежностью

ИИ-агенты превращаются из программного обеспечения, которое отвечает, в программное обеспечение, которое действует. Они вызывают API, переводят деньги и обновляют базы данных.

Но между интеллектом и надежностью существует огромный разрыв.

Мы фокусируемся на улучшении моделей и промптов. Мы игнорируем инфраструктуру. Это несоответствие приводит к сбоям в реальных условиях.

Представьте, что агент обрабатывает возврат средств. Он вызывает платежный API. API возвращает успех. Затем, прежде чем агент зафиксирует успех, происходит сбой сервера. Система повторяет задачу. Агент снова вызывает API. Клиент получает двойной возврат.

Никто не писал баг. Модель рассуждала правильно. API работал. Сбой произошел из-за того, что инфраструктура была неполной.

Большинство агентов отлично работают в демо-версиях. Демо работают в одном процессе. Они выполняют одну задачу за раз. Они не сталкиваются со сбоями или конкурентностью. В продакшене всё иначе.

Когда вы переносите агентов в продакшен, ломаются три вещи:

• Бессмертие процесса: Агенты предполагают, что процесс никогда не завершается. В реальности хосты выходят из строя, а деплои происходят постоянно. Когда процесс завершается, состояние в оперативной памяти исчезает. • Чистые вызовы инструментов: Разработчики относятся к вызовам инструментов как к простому чтению данных. Но агенты вызывают побочные эффекты. Перевод денег или отправку писем нельзя легко отменить. • Выполнение строго один раз (Exactly-once Execution): Повторные попытки необходимы для надежности. Но повторение цикла в оперативной памяти без надежного лога приводит к дублированию действий.

Это не проблема промптинга. Это проблема распределенных систем. Чтобы исправить это, нам нужно надежное выполнение (durable execution).

Надежным агентам необходимы эти пять столпов:

Лучшая модель принимает лучшие решения. Но лучшая модель не может исправить сбой. Надежность — это свойство выполнения, а не свойство решений.

Агенты, которым вы сможете доверить действия без контроля человека, будут не просто самыми умными. Они будут теми, кто работает на надежной инфраструктуре.

Интеллект определяет, что делать. Инфраструктура гарантирует, что это будет выполнено правильно.

Источник: https://dev.to/code_with_mwai/ai-agents-have-a-reliability-problem-nobody-is-talking-about-j40

Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi