У самого популярного ИИ-фреймворка прямо сейчас обнаружился фатальный изъян

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorial13 часов назад2мин чтения

У самого популярного ИИ-фреймворка прямо сейчас есть фатальный изъян

Сейчас каждый второй называет агентом всё подряд.

Функция, вызывающая инструмент, — это агент. Чат-бот с памятью — это агент. Скрипт с циклом — это агент. Это ошибка.

Когда нет четкого определения, вы переусложняете простые задачи и недорабатываете сложные. Я вижу, как команды тратят недели на агентскую оркестрацию рабочих процессов, которым нужен всего один хороший промпт.

Агенту нужна цель, а не просто инструкция. Агент сам решает, что делать дальше. Он обрабатывает ошибки. Он знает, когда работа завершена.

Если человек диктует системе каждый шаг, это чат-интерфейс.
Если система восстанавливается после неудачного вызова инструмента, вы на верном пути.
Если система разбивает цель на подзадачи, это настоящий агент.

Большинство успешных агентов узкоспециализированы. Они хорошо справляются с одной задачей: например, с поддержкой клиентов или извлечением данных из документов. Они не являются универсальными «движками рассуждений».

Успешные команды фокусируются на трех областях:

Проектирование инструментов: насколько чист интерфейс?
Обработка ошибок: что происходит, когда инструмент ничего не возвращает?
Наблюдаемость (observability): можете ли вы отследить, почему агент принял то или иное решение?

Команды, которые просто меняют модели в надежде на лучший результат, не меняя архитектуру, потерпят неудачу.

Фреймворки вроде LangChain или CrewAI значат меньше, чем паттерны. Паттерны работают независимо от инструмента.

Используйте следующие паттерны:

Планирование, затем выполнение: используйте один шаг для планирования и отдельный шаг для выполнения.
Разделение поиска и рассуждения: получение данных и их использование — это разные задачи.
Явная передача задач: используйте структурированные логи, когда один агент передает работу другому.

Фреймворк — это строительные леса. Архитектура — это само здание.

RAG также является источником ошибок. Большинство людей неправильно настраивают чанкинг (chunking). Если вы плохо разбиваете документ на фрагменты, модель теряет контекст.

Если ваш RAG возвращает правильные, но бесполезные результаты, исправьте чанкинг или метаданные. Не вините модель эмбеддингов.

Хватит гнаться за бенчмарками. Сосредоточьтесь на создании систем, которым можно доверять. Уделяйте внимание управлению (governance), наблюдаемости и надежному использованию инструментов.

Будут востребованы те инженеры, которые создают системы, пригодные для поддержки другими. Это системное проектирование, а не исследование моделей.

Источник: https://dev.to/aibughunter

У самого популярного ИИ-фреймворка прямо сейчас обнаружился фатальный изъян

Продолжить чтение

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗜𝘀 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁. 𝗛𝗲𝗿𝗲'𝘀 𝗪𝗵𝗮𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗜𝘀.

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

Контекстные окна становятся огромными

𝗧𝗵𝗲 𝗩𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗧𝗲𝘀𝘁 𝗘𝘃𝗲𝗿𝘆 𝗔𝗜 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗙𝗮𝗶𝗹𝘀