Kerangka Kerja AI Terpopuler Saat Ini Memiliki Cacat Fatal

Sekarang semua orang menyebut segala hal sebagai agen.

Sebuah fungsi yang memanggil tool adalah agen. Chatbot dengan memori adalah agen. Skrip dengan loop adalah agen. Ini adalah sebuah kesalahan.

Ketika Anda kekurangan definisi yang jelas, Anda melakukan over-engineering pada tugas-tugas sederhana. Anda melakukan under-engineering pada tugas-tugas kompleks. Saya melihat tim menghabiskan berminggu-minggu untuk orkestrasi agentic pada alur kerja yang sebenarnya hanya membutuhkan satu prompt yang bagus.

Seorang agen membutuhkan tujuan, bukan sekadar instruksi. Seorang agen memutuskan apa yang harus dilakukan selanjutnya. Ia menangani kegagalan. Ia tahu kapan ia selesai.

  • Jika manusia memberi tahu sistem setiap langkahnya, itu adalah antarmuka chat.
  • Jika sebuah sistem pulih dari kegagalan pemanggilan tool, Anda sedang membuat kemajuan.
  • Jika sebuah sistem memecah tujuan menjadi sub-tugas, itulah agen yang sebenarnya.

Sebagian besar agen yang sukses bersifat sempit (narrow). Mereka melakukan satu hal dengan baik. Mereka menangani dukungan pelanggan atau ekstraksi dokumen. Mereka bukanlah mesin penalaran umum (general reasoning engines).

Tim yang sukses berfokus pada tiga area ini:

  • Desain tool: Seberapa bersih antarmukanya?
  • Penanganan kegagalan: Apa yang terjadi ketika sebuah tool tidak mengembalikan apa pun?
  • Observabilitas: Bisakah Anda melacak mengapa agen tersebut mengambil keputusan?

Tim yang mengganti model dan mengharapkan hasil yang lebih baik tanpa mengubah arsitektur mereka akan gagal.

Framework seperti LangChain atau CrewAI kurang penting dibandingkan pola (patterns). Pola tetap bekerja terlepas dari tool yang digunakan.

Gunakan pola-pola ini:

  • Rencanakan lalu eksekusi: Gunakan satu langkah untuk merencanakan dan langkah terpisah untuk mengeksekusi.
  • Pisahkan retrieval dari penalaran: Mengambil data dan menggunakan data adalah pekerjaan yang berbeda.
  • Serah terima eksplisit (explicit handoffs): Gunakan log terstruktur saat satu agen menyerahkan pekerjaan ke agen lain.

Framework adalah perancah (scaffolding). Arsitektur adalah bangunannya.

RAG juga merupakan sumber kegagalan. Kebanyakan orang melakukan chunking dengan salah. Jika Anda membagi dokumen dengan buruk, model akan kehilangan konteks.

Jika RAG Anda mengembalikan hasil yang benar tetapi tidak berguna, perbaiki chunking atau metadata Anda. Jangan salahkan model embedding.

Berhentilah mengejar benchmark. Fokuslah pada membangun sistem yang dapat Anda percayai. Fokuslah pada tata kelola (governance), observabilitas, dan penggunaan tool yang andal.

Insinyur yang penting adalah mereka yang membangun sistem yang dapat dipelihara oleh orang lain. Ini adalah desain sistem, bukan riset model.

Sumber: https://dev.to/aibughunter/the-hottest-ai-framework-right-now-has-a-fatal-flaw-nobody-mentions-3hd1

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi