𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

📅2 hours ago⏱2 min read

У ИИ-агентов есть проблема с надежностью

ИИ-агенты превращаются из программного обеспечения, которое отвечает, в программное обеспечение, которое действует. Они вызывают API, переводят деньги и обновляют базы данных.

Но между интеллектом и надежностью существует огромный разрыв.

Мы фокусируемся на улучшении моделей и промптов. Мы игнорируем инфраструктуру. Это несоответствие приводит к сбоям в реальных условиях.

Представьте, что агент обрабатывает возврат средств. Он вызывает платежный API. API возвращает успех. Затем, прежде чем агент зафиксирует успех, происходит сбой сервера. Система повторяет задачу. Агент снова вызывает API. Клиент получает двойной возврат.

Никто не писал баг. Модель рассуждала правильно. API работал. Сбой произошел из-за того, что инфраструктура была неполной.

Большинство агентов отлично работают в демо-версиях. Демо работают в одном процессе. Они выполняют одну задачу за раз. Они не сталкиваются со сбоями или конкурентностью. В продакшене всё иначе.

Когда вы переносите агентов в продакшен, ломаются три вещи:

• Бессмертие процесса: Агенты предполагают, что процесс никогда не завершается. В реальности хосты выходят из строя, а деплои происходят постоянно. Когда процесс завершается, состояние в оперативной памяти исчезает. • Чистые вызовы инструментов: Разработчики относятся к вызовам инструментов как к простому чтению данных. Но агенты вызывают побочные эффекты. Перевод денег или отправку писем нельзя легко отменить. • Выполнение строго один раз (Exactly-once Execution): Повторные попытки необходимы для надежности. Но повторение цикла в оперативной памяти без надежного лога приводит к дублированию действий.

Это не проблема промптинга. Это проблема распределенных систем. Чтобы исправить это, нам нужно надежное выполнение (durable execution).

Надежным агентам необходимы эти пять столпов:

Event Sourcing: Храните неизменяемый лог каждого действия. Лог является источником истины, а не состояние в оперативной памяти.
Воспроизводимое выполнение (Replayable Execution): Используйте лог для восстановления состояния после сбоя. Воспроизводите завершенные шаги вместо их повторного запуска.
Надежные очереди (Durable Queues): Переносите работу из памяти в постоянные хранилища.
Ключи идемпотентности (Idempotency Keys): Гарантируйте, что выполнение действия дважды дает тот же эффект, что и однократное выполнение. Это предотвращает двойные платежи.
Паттерны компенсации (Compensation Patterns): Определяйте действия для отмены шагов, если многоэтапный рабочий процесс прерывается на полпути.

Лучшая модель принимает лучшие решения. Но лучшая модель не может исправить сбой. Надежность — это свойство выполнения, а не свойство решений.

Агенты, которым вы сможете доверить действия без контроля человека, будут не просто самыми умными. Они будут теми, кто работает на надежной инфраструктуре.

Интеллект определяет, что делать. Инфраструктура гарантирует, что это будет выполнено правильно.

Источник: https://dev.to/code_with_mwai/ai-agents-have-a-reliability-problem-nobody-is-talking-about-j40

Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

Continue reading

Понимание отказоустойчивых ИИ-агентов

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝟳 𝗖𝗿𝗶𝘁𝗶𝗰𝗮𝗹 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

Почему ИИ-агенты терпят неудачу в продакшене