Google, Gemini 에이전트 구축의 기본 방식으로 Interactions API 채택

Google이 Gemini를 활용하는 방식을 바꾸고 있습니다.

Interactions API가 이제 정식 출시(GA)되었습니다. 이제 Gemini 모델 및 에이전트와 작업하는 주요 방식이 됩니다.

이는 개발자들에게 중대한 변화입니다. Google은 '에이전트 우선(agent-first)' 방식으로 전환하고 있습니다. 기존의 generateContent API도 여전히 작동하지만, 새로운 에이전트 기능은 Interactions API에 가장 먼저 도입될 예정입니다.

Interactions API의 주요 기능:

• 모든 것을 위한 단일 엔드포인트. 간단한 작업에는 model ID를, 긴 작업에는 agent ID를 사용하세요. • Managed Agents. API 호출 한 번으로 Linux 샌드박스를 설정합니다. 에이전트는 코드를 실행하고, 웹을 탐색하며, 파일을 관리할 수 있습니다. • 백그라운드 작업. background=True로 설정하여 대기 시간 없이 긴 작업을 실행할 수 있습니다. • 도구 혼합. Google Search 및 Google Maps를 사용자 정의 함수와 결합하여 하나의 요청으로 처리할 수 있습니다. • Deep Research. 네이티브 차트와 이미지 및 PDF에 대한 멀티모달 지원을 통해 더 나은 속도와 깊이를 경험하세요. • 미디어 생성. 이미지, 음악, TTS(text-to-speech) 도구에 액세스할 수 있습니다. • 비용 제어. Flex 또는 Priority 티어를 사용하세요. Flex 티어는 50% 더 저렴한 비용을 제공합니다. • 상태 유지. 유료 사용자는 지난 55일간의 상호작용 내역에 액세스할 수 있습니다.

아키텍처 또한 변화하고 있습니다. Google은 기존의 메시지 형식을 탈피하고 있습니다. 이제 각 단계는 사용자 입력, 사고(thought), 또는 함수 호출(function call)과 같은 타입화된 액션(typed action)으로 처리됩니다.

어떻게 해야 할까요?

새로운 Gemini 프로젝트를 시작한다면 Interactions API를 사용하세요.

기존 앱이 있다면 그대로 유지하되, 워크플로우를 점검하세요. 백그라운드 실행이나 Managed Agents가 필요한지 확인해 보시기 바랍니다.

SDK를 확인하세요. Google은 LiteLLM, Eigent, Agno와 같은 파트너를 지원합니다.

비용을 관리하세요. 속도보다 가격이 중요한 워크로드의 경우 Flex 티어를 테스트해 보세요.

Managed Agents는 Google 측에서 실행된다는 점에 유의하세요. 민감한 데이터를 다루는 경우 샌드박스 동작과 데이터 제어 기능을 검토하십시오.

Google이 기존 API를 중단하는 것은 아닙니다. 그들은 미래를 보여주고 있는 것입니다. 기존 방식으로만 개발한다면 최고의 새로운 기능들을 놓칠 수도 있습니다.

출처: https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi