Оболочка — это половина архитектуры

В индустрии используется определенное уравнение: Агент = Модель + Оболочка (Harness).

Если вы не модель, то вы — оболочка. Такой взгляд рассматривает всё остальное как вспомогательную инфраструктуру. Он предполагает, что модель — это двигатель, а оболочка — лишь шасси или топливная система.

Эта логика ошибочна.

Автомобиль — это не двигатель с аксессуарами. Автомобиль — это система равноправных подсистем. Тормоза не обслуживают двигатель. Электросистема не обслуживает двигатель. Если откажут тормоза, откажет весь автомобиль. Мощность двигателя не имеет значения, если транспортное средство не может остановиться.

ИИ-агенты работают так же.

Современная архитектура агентов объединяет верификацию, намерения (intent) и координацию в одну подчиненную категорию под названием «оболочка». Эта ошибка приводит к проектированию недостаточно совершенных систем.

Верификация — это не оболочка. Это равноправная подсистема. Намерения — это не вспомогательная инфраструктура. Это подсистема, которая направляет генерацию. Координация — это не обертка над моделью. Это подсистема, которая делает работу мультиагентных систем связной.

Если верификация не проходит, ваш агент не работает. Неважно, насколько умна модель.

Математика доказывает, что этот разрыв реален. Доказательство NIST показывает, что никакой конечный набор ограничений (guardrails) не может быть универсально устойчивым ко всем входным данным. Это нельзя исправить, создав лучшую оболочку. Нельзя обернуть модель в достаточное количество правил, чтобы сделать её идеальной. Пробелы будут существовать всегда.

Индустрия делает ставку на то, что более совершенные модели со временем поглотят эти проблемы. Это ошибка. История аппаратного обеспечения показывает, что более быстрые процессоры не устранили потребность в контроллерах памяти или кэше. У каждой подсистемы своя физика и свои ограничения.

Чтобы создавать настоящих агентов, вам нужны четыре вещи, которых не хватает текущей модели «оболочки»:

  • Слой спецификаций: созданные человеком декларации того, что именно считается правильным.
  • Независимый шлюз верификации: механический контролер, который не является самой моделью.
  • Дисциплина исключения: способ определить, какого кода не должно существовать, чтобы предотвратить раздувание системы.
  • Координация через протоколы: использование спецификаций вместо просто общих файловых систем.

Оболочка делает модель лучшим производителем. Слой спецификаций делает систему ответственной.

Вам нужны оба компонента. Если вы строите только первый, вы упретесь в потолок, который, согласно математике, невозможно пробить.

Source: https://dev.to/bala_paranj_059d338e44e7e/the-harness-is-half-the-architecture-heres-the-half-thats-missing-1fb9

Optional learning community: https://t.me/GyaanSetuAi