物理 AI 遇上软件智能体
本周,两项重大发布改变了 AI 格局。阿里巴巴推出了机器人模型。OpenAI 发布了一个智能体框架。
阿里巴巴发布了 Qwen-Robot。这些模型可以帮助机器人移动并触摸物体。其中一个模型专注于手部动作,将视觉与物理控制相结合。
关于 Qwen-Robot 的关键事实:
- 它采用了视觉-语言-动作 (Vision-Language-Action) 架构。
- 机器人能够观察、思考并随后采取行动。
- 它利用工业数据应用于物流和制造业。
- 它是一个面向研究人员的开放权重发布。
这标志着阿里巴巴从电子商务向物理智能领域迈进。它正在与 Google 和 NVIDIA 展开竞争。
与此同时,OpenAI 开源了其 Agents SDK。你只需 50 行 Python 代码即可构建多智能体系统。
为什么这个 SDK 至关重要:
- 它支持任何模型提供商。
- 它管理智能体之间的交接。一个智能体可以将任务传递给专家智能体。
- 它包含工具集成和并行执行功能。
- 它在 3 个月内下载量达到了 1000 万次。
你可以将智能体串联起来。一个代码智能体编写代码,一个测试智能体进行检查,一个部署智能体完成工作。它们无需额外代码即可协同工作。
这些发布展示了一个共同的方向。阿里巴巴赋予了机器人“双手”,而 OpenAI 则为这些双手提供了协调任务的“大脑”。
你现在就可以使用这两个框架。它们是免费且开放的。
你认为每个 AI 模型很快都会拥有物理实体吗?欢迎分享你的看法。
Optional learning community: https://t.me/GyaanSetuAi