Google робить Interactions API стандартом розробки з Gemini Agents

Google змінює підхід до розробки з Gemini.

Interactions API тепер доступний у загальному доступі. Це основний спосіб роботи з моделями та агентами Gemini.

Це серйозний зсув для розробників. Google переходить до підходу agent-first. Хоча старий generateContent API все ще працює, нові функції агентів з'являтимуться в Interactions API насамперед.

Ключові особливості Interactions API:

• Єдина кінцева точка для всього. Використовуйте model ID для простих завдань або agent ID для тривалих завдань. • Managed Agents. Один виклик API створює Linux-пісочницю. Агент може виконувати код, переглядати вебсторінки та керувати файлами. • Фонові завдання. Встановіть background=True, щоб виконувати тривалі завдання без очікування. • Поєднання інструментів. Поєднуйте Google Search та Google Maps із власними функціями в одному запиті. • Deep Research. Отримуйте кращу швидкість і глибину завдяки вбудованим діаграмам та мультимодальній підтримці зображень і PDF. • Генерація медіа. Доступ до інструментів створення зображень, музики та text-to-speech. • Контроль витрат. Використовуйте рівні Flex або Priority. Рівень Flex пропонує на 50% нижчі витрати. • Збереження стану. Платні користувачі можуть мати доступ до попередніх взаємодій протягом 55 днів.

Архітектура також змінюється. Google відходить від старих форматів повідомлень. Кожен крок тепер є типізованою дією, такою як user input, thought або function call.

Що вам варто зробити?

Якщо ви запускаєте новий проєкт Gemini, використовуйте Interactions API.

Якщо у вас є готовий застосунок, продовжуйте його роботу. Але проведіть аудит своїх робочих процесів. Перевірте, чи потрібне вам фонове виконання або managed agents.

Перевірте свої SDK. Google підтримує таких партнерів, як LiteLLM, Eigent та Agno.

Стежте за витратами. Протестуйте рівень Flex для навантажень, де ціна важливіша за швидкість.

Зауважте, що Managed Agents працюють на стороні Google. Перегляньте поведінку пісочниці та засоби контролю даних, якщо ви працюєте з конфіденційною інформацією.

Google не вимикає старий API. Вони показують вам майбутнє. Якщо ви продовжуватимете розробку за старим шляхом, ви можете пропустити найкращі нові функції.

Джерело: https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi