Фізичний ШІ зустрічається з програмними агентами
Цього тижня два важливі релізи змінили ландшафт ШІ. Alibaba запустила моделі для роботів. OpenAI випустила фреймворк для агентів.
Alibaba випустила Qwen-Robot. Ці моделі допомагають роботам рухатися та торкатися об'єктів. Одна модель зосереджена на рухах рук. Вона поєднує зір із фізичним керуванням.
Ключові факти про Qwen-Robot:
- Використовує архітектуру Vision-Language-Action.
- Робот бачить, думає, а потім діє.
- Використовує промислові дані для логістики та виробництва.
- Це реліз із відкритими вагами для дослідників.
Це переводить Alibaba з електронної комерції у сферу фізичного інтелекту. Компанія конкурує з Google та NVIDIA.
Водночас OpenAI відкрила вихідний код свого Agents SDK. Ви можете створювати мультиагентні системи за допомогою лише 50 рядків коду на Python.
Чому цей SDK важливий:
- Працює з будь-яким постачальником моделей.
- Керує передачею завдань між агентами. Один агент передає завдання спеціалісту.
- Включає інтеграцію інструментів та паралельне виконання.
- Досяг 10 мільйонів завантажень за 3 місяці.
Ви можете об'єднувати агентів у ланцюжки. Агент для написання коду пише код. Агент для тестування перевіряє його. Агент для розгортання завершує роботу. Вони працюють разом без додаткового коду.
Ці релізи вказують на один напрямок. Alibaba дає роботам руки. OpenAI дає цим рукам «мозок» для координації завдань.
Ви можете використовувати обидва фреймворки вже сьогодні. Вони безкоштовні та відкриті.
Як ви вважаєте, чи скоро кожна модель ШІ матиме фізичне тіло? Діліться своїми думками.
Додаткова спільнота для навчання: https://t.me/GyaanSetuAi