API Gemini Interactions: Pengakhiran Middleware Ejen?
Google baru sahaja mengubah cara anda membina ejen AI.
Interactions API kini tersedia secara umum. Ia merupakan cara utama baharu untuk bekerja dengan model dan ejen Gemini. Kemas kini ini menjadikan kebanyakan rangka kerja orkestrasi seperti LangGraph atau CrewAI tidak lagi diperlukan untuk tugasan mudah.
Sebelum ini, anda perlu menyambungkan empat perkara:
- Panggilan model
- Pelaksanaan alatan
- Keadaan perbualan
- Kitaran hayat ejen
Kini, Google menggabungkan kesemuanya ke dalam satu kontrak sebelah pelayan (server-side).
Apa maksudnya untuk anda:
• Pelaksanaan Bersatu Anda tidak lagi perlu menguruskan "plumbing". Satu panggilan API mengendalikan inferens, alatan, dan keadaan.
• Keadaan Sebelah Pelayan (Server-Side State)
Anda tidak perlu menguruskan sejarah dalam Redis atau pangkalan data vektor untuk memori jangka pendek. Google mengendalikan sesi melalui session_id. Ini menghapuskan keperluan untuk pengurusan tetingkap konteks yang kompleks.
• Ejen Terurus Anda boleh memanggil ID ejen seperti "antigravity" untuk mencetuskan sandbox Linux jauh. Ejen ini boleh menaakul, menjalankan kod, dan melayari web tanpa anda perlu menyediakan sebarang infrastruktur.
• Pelaksanaan Latar Belakang
Tetapkan background=True untuk tugasan yang berjalan lama. Pelayan menjalankan kerja tersebut secara asinkronus. Anda tidak lagi perlu membina barisan kerja (job queues) atau gelung polling anda sendiri.
Imbangan: Kebolehalihan vs. Kemudahan
Cabaran utamanya ialah lock-in. Oleh kerana keadaan perbualan anda berada di pelayan Google, anda tidak boleh memindahkan keadaan tersebut ke OpenAI atau Anthropic dengan mudah. Anda mendapat kelajuan dan mengurangkan kod boilerplate, tetapi anda kehilangan keupayaan untuk menukar penyedia dengan mudah.
Nasihat saya untuk pembangun:
- Gunakan Interactions API untuk laluan ejen yang linear dan stateful.
- Kekalkan LangGraph untuk aliran kerja yang kompleks, bercabang, atau kitaran (cyclic).
- Simpan pengetahuan jangka panjang anda dalam pangkalan data vektor anda sendiri untuk kekal boleh alih.
- Pantau kos pengkomputeran sandbox dengan teliti, kerana ia dicaj secara berasingan daripada token.
Era membina sejumlah besar "glue code" sedang berakhir. Google memindahkan lapisan orkestrasi daripada kod anda ke pelayan mereka.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
