Melampaui Chatbot: Mengapa AI Mesti Beralih daripada Menjawab kepada Melaksanakan

Era AI reaktif sedang berakhir. Kita sedang beralih daripada Model Bahasa Besar (LLM) yang sekadar menjana teks yang munasabah kepada ejen autonomi yang mampu melaksanakan aliran kerja pelbagai langkah yang kompleks dalam persekitaran digital yang berterusan.

Daripada Intuisi Pantas kepada Penaakulan Perlahan

Evolusi AI semasa ditakrifkan oleh peralihan asas dalam logik pengkomputeran. Chatbot tradisional beroperasi berdasarkan pemikiran "Sistem 1"—pantas, intuitif, dan penjanaan token demi token berdasarkan kebarangkalian statistik. Model-model ini memberikan jawapan segera tetapi kekurangan keupayaan untuk mengesahkan logik mereka sendiri atau membetulkan ralat di tengah jalan.

Kemunculan "LLM berfikir," yang diterajui oleh model seperti OpenAI o1 dan DeepSeek-R1, telah memperkenalkan penaakulan "Sistem 2." Dengan melaburkan lebih banyak pengkomputeran semasa masa inferens, model-model ini menggunakan pembelajaran pengukuhan untuk menjana rantaian pemikiran yang panjang. Ia meneroka laluan penyelesaian, mengesahkan langkah-langkah perantara, dan membetulkan diri sendiri, bagi memastikan hanya penyelesaian yang boleh disahkan betul sahaja yang dibentangkan. Peralihan ini merupakan langkah pertama ke arah mengubah model daripada pengganti enjin carian kepada enjin penaakulan.

Era OpenClaw: Integrasi Ruang Kerja dan Kemahiran

Walaupun penaakulan adalah penting, penaakulan semata-mata tidak dapat menyiapkan kerja. Para penyelidik berpendapat bahawa lonjakan besar seterusnya—era "OpenClaw"—memerlukan peralihan daripada panggilan alat (tool calls) yang rapuh dan sekali guna kepada ruang kerja yang selamat dan berterusan.

Kejayaan besar ini terletak pada gabungan Ruang Kerja (Workspace) dan Kemahiran (Skill):

  • Ruang Kerja (Workspace): Persekitaran berterusan yang mengandungi fail, terminal, log, dan pelayar. Tidak seperti ejen awal yang kehilangan konteks antara langkah, ruang kerja menyediakan "keadaan" (state), bermakna AI boleh berinteraksi dengan persekitaran yang stabil di mana tindakan mempunyai kesan yang berpanjangan.
  • Kemahiran (Skills): Melangkaui arahan (prompt) ringkas, "kemahiran" adalah kumpulan pengetahuan operasi yang modular dan boleh digunakan semula. Sebagai contoh, Agent Skills daripada Anthropic menggunakan fail SKILL.md untuk membungkus arahan dan skrip. Ini membolehkan organisasi merakam kepakaran institusi dalam format yang mudah alih dan bukannya mencipta semula aliran kerja dengan setiap arahan.

Mendefinisikan Semula Kejayaan: Penutupan Tugasan lwn Ketepatan Jawapan

Apabila AI beralih ke ruang kerja, metrik untuk "kecerdasan" mesti berubah. Dalam era chatbot, model dinilai berdasarkan ketepatan jawapan mereka. Dalam era ejen, kejayaan diukur melalui penutupan tugasan (task closure): keupayaan untuk membawa persekitaran sasaran ke keadaan akhir yang boleh disahkan.

Peralihan ini dibuktikan oleh kerumitan penanda aras (benchmark) moden. Walaupun GPT-4 cemerlang dalam teks, ia pada mulanya hanya menyiapkan 14% tugasan dalam penanda aras WebArena, yang mensimulasikan persekitaran web dunia sebenar. Kejayaan kini memerlukan analisis "trajektori keadaan-tindakan-pemerhatian" (state-action-observation trajectories)—memerhatikan bagaimana ejen bergerak melalui sesuatu sistem—bukannya sekadar membaca output akhirnya.

Sempadan Baharu Keselamatan dan Tadbir Urus

Autonomi yang meningkat membawa risiko yang lebih tinggi. Oleh kerana ejen berasaskan ruang kerja memegang kredensial, token identiti, dan akses ke repositori sensitif, mereka memperluaskan permukaan serangan AI. Rangka kerja yang sedang muncul seperti OpenClaw PRISM dan ClawGuard memberi tumpuan kepada penciptaan "harness" yang merangkumi kawalan kebenaran, penjejakan asal-usul (provenance tracking), dan sandboxing. Untuk AI menjadi rakan sekerja yang sebenar, pembangun mesti menyelesaikan masalah pengunduran (rollback), kedaulatan data, dan kebersihan ruang kerja bagi memastikan kesilapan ejen tidak menjadi kecacatan seni bina yang kekal.

Ringkasan Utama

  • Peralihan Penaakulan: AI beralih daripada penaakulan "Sistem 1" (pantas, reaktif) kepada "Sistem 2" (perlahan, sengaja), dengan menggunakan pengkomputeran tambahan semasa masa inferens untuk membetulkan diri sendiri.
  • Ruang Kerja + Kemahiran: Autonomi sebenar memerlukan ruang kerja digital yang berterusan yang dipadankan dengan "kemahiran" modular dan boleh digunakan semula untuk memastikan aliran kerja boleh diulang dan diskalakan.
  • Metrik Penilaian Baharu: Kejayaan bukan lagi tentang kemunasabahan respons teks, tetapi tentang "penutupan tugasan"—menyiapkan aliran kerja secara boleh disahkan dalam persekitaran yang kompleks.