물리적 AI와 소프트웨어 에이전트의 만남

이번 주 두 가지 주요 출시가 AI 지형을 바꾸어 놓았습니다. Alibaba는 로봇 모델을 출시했고, OpenAI는 에이전트 프레임워크를 공개했습니다.

Alibaba가 Qwen-Robot을 출시했습니다. 이 모델들은 로봇이 움직이고 물체를 만질 수 있도록 돕습니다. 한 모델은 손의 움직임에 집중하며, 시각 정보와 물리적 제어를 연결합니다.

Qwen-Robot에 대한 주요 사실:

  • Vision-Language-Action 아키텍처를 사용합니다.
  • 로봇이 보고, 생각하고, 행동합니다.
  • 물류 및 제조를 위한 산업 데이터를 사용합니다.
  • 연구자들을 위해 오픈 웨이트(open-weight)로 공개되었습니다.

이를 통해 Alibaba는 이커머스를 넘어 물리적 지능(physical intelligence) 분야로 진출하게 되었습니다. 이는 Google 및 NVIDIA와 경쟁하는 구도입니다.

동시에 OpenAI는 Agents SDK를 오픈 소스로 공개했습니다. 단 50줄의 Python 코드로 멀티 에이전트 시스템을 구축할 수 있습니다.

이 SDK가 중요한 이유:

  • 어떤 모델 제공업체와도 연동됩니다.
  • 에이전트 간의 업무 인계(handoff)를 관리합니다. 한 에이전트가 전문 에이전트에게 작업을 전달합니다.
  • 도구 통합 및 병렬 실행 기능을 포함합니다.
  • 출시 3개월 만에 1,000만 다운로드를 달성했습니다.

에이전트들을 서로 연결할 수 있습니다. 코드 에이전트가 코드를 작성하면, 테스트 에이전트가 이를 검토하고, 배포 에이전트가 작업을 마무리합니다. 추가 코드 없이도 이들은 함께 협업합니다.

이러한 출시들은 하나의 방향성을 보여줍니다. Alibaba는 로봇에게 손을 부여하고, OpenAI는 그 손이 작업을 조율할 수 있도록 두뇌를 제공하는 것입니다.

지금 바로 두 프레임워크를 모두 사용할 수 있습니다. 이들은 무료이며 공개되어 있습니다.

곧 모든 AI 모델이 물리적인 몸을 갖게 될 것이라고 생각하시나요? 여러분의 생각을 공유해 주세요.

Source: https://dev.to/doremonai/alibaba-qwen-robot-amp-openai-agent-sdk-the-week-physical-ai-met-software-agents-11nk

Optional learning community: https://t.me/GyaanSetuAi