Gemini Interactions API: 에이전트 미들웨어의 종말인가?
Google이 AI 에이전트를 구축하는 방식을 방금 바꾸었습니다.
Interactions API가 이제 정식 출시(GA)되었습니다. 이는 Gemini 모델 및 에이전트와 작업하는 새로운 주요 방식입니다. 이번 업데이트로 인해 간단한 작업의 경우 LangGraph나 CrewAI와 같은 대부분의 오케스트레이션 프레임워크가 불필요해졌습니다.
이전에는 다음 네 가지 요소를 하나로 묶어야 했습니다:
- 모델 호출
- 도구 실행
- 대화 상태
- 에이전트 라이프사이클
이제 Google은 이 모든 것을 단일 서버 측 계약(contract)으로 통합합니다.
사용자에게 미치는 영향:
• 통합된 실행 더 이상 "배관 작업(plumbing)"을 관리할 필요가 없습니다. 단 한 번의 API 호출로 추론, 도구, 상태를 모두 처리합니다.
• 서버 측 상태
단기 기억을 위해 Redis나 벡터 데이터베이스에서 히스토리를 관리할 필요가 없습니다. Google이 session_id를 통해 세션을 관리합니다. 이를 통해 복잡한 컨텍스트 윈도우 관리의 필요성이 사라집니다.
• 관리형 에이전트 "antigravity"와 같은 에이전트 ID를 호출하여 원격 Linux 샌드박스를 실행할 수 있습니다. 이 에이전트는 인프라를 직접 구축하지 않고도 추론, 코드 실행, 웹 브라우징을 수행할 수 있습니다.
• 백그라운드 실행
오래 걸리는 작업의 경우 background=True로 설정하세요. 서버가 작업을 비동기적으로 실행합니다. 더 이상 자체 작업 큐(job queue)나 폴링 루프(polling loop)를 구축할 필요가 없습니다.
트레이드오프: 이식성 vs 편의성
가장 큰 문제는 락인(lock-in) 효과입니다. 대화 상태가 Google 서버에 저장되기 때문에, 해당 상태를 OpenAI나 Anthropic으로 쉽게 옮길 수 없습니다. 속도가 빨라지고 보일러플레이트 코드가 줄어들지만, 제공업체를 쉽게 전환할 수 있는 능력은 상실하게 됩니다.
개발자를 위한 조언:
- 선형적이고 상태를 유지하는(stateful) 에이전트 경로에는 Interactions API를 사용하세요.
- 복잡하거나 분기형 또는 순환형 워크플로우에는 LangGraph를 계속 사용하세요.
- 이식성을 유지하려면 장기 지식은 자체 벡터 데이터베이스에 보관하세요.
- 샌드박스 컴퓨팅 비용은 토큰과 별도로 청구되므로 주의 깊게 모니터링하세요.
방대한 양의 "글루 코드(glue code)"를 구축하던 시대가 끝나가고 있습니다. Google은 오케스트레이션 계층을 사용자의 코드에서 자신들의 서버로 옮기고 있습니다.
Optional learning community: https://t.me/GyaanSetuAi
