Тест на життєздатність, який провалює кожна архітектура ШІ

Більшість архітектур розробки ШІ є зламаними.

Індустрія дотримується простої формули: Агент = Модель + Harness. Ця логіка розглядає модель як усю систему. Це помилка.

Для роботи системи необхідні п'ять основних елементів. Якщо випустити один — система не спрацює. Якщо прибрати один — система загине.

Сучасні архітектури ШІ зазнають невдачі, бо в них бракує двох із цих п'яти частин.

П'ять елементів:

  • Інструмент (Модель): Він створює результат, наприклад, код або тести. Це основна діяльність, але це не вся система.
  • Двигун (Специфікація): Це намір людини. Це стійке, версіоноване та перевіряльне визначення того, як виглядає успіх. Без нього генерація не має напрямку.
  • Трансмісія (Доставка): Вона переносить зміни від коду до розгортання через CI/CD та машиночитані контракти.
  • Блок керування (Незалежна перевірка): Це той самий відсутній елемент. Це незалежний шлюз, який порівнює результат зі специфікацією. Це не сама модель, що перевіряє себе. Це має бути детермінована система, як-от перевірка типів (type checker) або набір тестів (test suite).
  • Корпус (Межі та безперервність): Він захищає систему. Він використовує ізоляцію модулів, щоб агенти не перетинали межі. Він також використовує метод віднімання, щоб запобігти зайвому розростанню коду.

Проблема підходу «Модель + Harness» полягає в тому, що він зосереджений лише на інструменті.

Потужний інструмент без блока керування — це машина, що виробляє неперевірені помилки. Швидка трансмісія без блока керування — це поштова служба, яка з ідеальною надійністю доставляє бомби.

Ось чому потужніші моделі часто лише погіршують ситуацію. Вони просто швидше генерують неперевірений результат.

Щоб масштабуватися до сотень агентів, вам потрібна не краща оркестрація. Вам потрібна краща декомпозиція.

Агенти не повинні працювати з тими самими файлами. Вони мають працювати з незалежними модулями, визначеними суворими інтерфейсами та контрактами. Саме так працюють людські інженерні команди. Вони не координують натискання клавіш; вони координують роботу через API та специфікації.

Досить питати, що потрібно моделі. Почніть питати, що потрібно системі для створення правильного програмного забезпечення.

Джерело: https://dev.to/bala_paranj_059d338e44e7e/the-viability-test-every-ai-dev-architecture-fails-d3

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi