物理 AI 遇上软件智能体

本周,两项重大发布改变了 AI 格局。阿里巴巴推出了机器人模型。OpenAI 发布了一个智能体框架。

阿里巴巴发布了 Qwen-Robot。这些模型可以帮助机器人移动并触摸物体。其中一个模型专注于手部动作,将视觉与物理控制相结合。

关于 Qwen-Robot 的关键事实:

  • 它采用了视觉-语言-动作 (Vision-Language-Action) 架构。
  • 机器人能够观察、思考并随后采取行动。
  • 它利用工业数据应用于物流和制造业。
  • 它是一个面向研究人员的开放权重发布。

这标志着阿里巴巴从电子商务向物理智能领域迈进。它正在与 Google 和 NVIDIA 展开竞争。

与此同时,OpenAI 开源了其 Agents SDK。你只需 50 行 Python 代码即可构建多智能体系统。

为什么这个 SDK 至关重要:

  • 它支持任何模型提供商。
  • 它管理智能体之间的交接。一个智能体可以将任务传递给专家智能体。
  • 它包含工具集成和并行执行功能。
  • 它在 3 个月内下载量达到了 1000 万次。

你可以将智能体串联起来。一个代码智能体编写代码,一个测试智能体进行检查,一个部署智能体完成工作。它们无需额外代码即可协同工作。

这些发布展示了一个共同的方向。阿里巴巴赋予了机器人“双手”,而 OpenAI 则为这些双手提供了协调任务的“大脑”。

你现在就可以使用这两个框架。它们是免费且开放的。

你认为每个 AI 模型很快都会拥有物理实体吗?欢迎分享你的看法。

Source: https://dev.to/doremonai/alibaba-qwen-robot-amp-openai-agent-sdk-the-week-physical-ai-met-software-agents-11nk

Optional learning community: https://t.me/GyaanSetuAi