Pernahkah Anda Terjebak oleh Asisten AI?
AI mengatakan sebuah tugas telah selesai. Anda mempercayainya. Lalu Anda menghabiskan waktu berhari-hari untuk menyadari bahwa ia tidak pernah menyelesaikan pekerjaan tersebut.
Saya menyebut ini sebagai gap (celah). Ini adalah ruang antara apa yang dilaporkan AI dan apa yang sebenarnya terjadi.
Lubang itu bersembunyi di dalam celah tersebut. Terkadang AI yang bersalah. Terkadang saya yang bersalah. Terkadang aspek engineering yang bersalah.
Berikut adalah tiga contoh nyata:
- Jebakan Provenance Saya meminta AI untuk memulihkan kode dari sebuah git branch. Ia mengatakan telah mengambilnya dari branch lain. Ternyata tidak. Ia sebenarnya menulis ulang kode tersebut secara manual.
Sebuah cherry-pick memiliki riwayat yang bisa Anda telusuri. Penulisan ulang manual adalah sebuah orphan. Terlihat benar, tetapi tidak memiliki silsilah. Ketika saya mendesak untuk mencari kebenaran, AI tersebut mengakuinya.
Pelajaran: Klaim provenance AI tidak dapat diandalkan. Jangan tanya apa yang telah ia lakukan. Lihatlah git history untuk melihat apa yang sebenarnya ia lakukan.
- Jebakan Spot-Check Saya meminta AI untuk mengubah logika form. Ia berkata "selesai." Saya menghabiskan empat hari untuk melakukan debugging pada front end.
Sebuah diff baris demi baris menunjukkan bahwa ia mengubah empat dari lima scope. Saya melihat banyak perubahan kode dan berasumsi sisanya baik-baik saja. Otak saya mengisi kekosongan tersebut.
Semakin besar perubahannya, semakin dalam jebakannya. Perubahan besar meningkatkan rasa percaya diri Anda, sementara cakupan (coverage) aktual Anda justru menurun.
Pelajaran: Jangan sekadar memindai. Hitunglah. Jika Anda memiliki lima tugas, verifikasi kelima tugas tersebut satu per satu.
- Jebakan Engineering Sebuah AI terjebak dalam sebuah loop. Saya pikir ia sedang berpikir mendalam, jadi saya menunggu. Ternyata ia hanya menghabiskan kuota API saya.
Model menghasilkan token. Ia tidak mengelola anggaran (budget). Kontrol loop, timeout, dan batas anggaran (budget caps) adalah bagian dari lapisan engineering.
Pelajaran: Setiap agen otomatis harus memiliki batasan langkah (step limits) dan batas anggaran (budget caps). Jangan mengandalkan model untuk menghentikan dirinya sendiri.
Kesimpulannya:
Kata-kata AI adalah kesaksian, bukan vonis.
Kesaksian adalah apa yang dikatakannya. Vonis adalah bukti fisik.
- Jika ia berkata "diperbaiki," periksa diff-nya.
- Jika ia berkata "diambil," periksa git log-nya.
- Jika ia berkata "sedang berpikir," periksa penggunaan token-nya.
Kedewasaan bukanlah belajar untuk mempercayai AI. Melainkan belajar untuk selalu memperlakukan kata-katanya sebagai kesaksian.
Sumber: https://dev.to/chenghongm/ever-been-burned-by-your-ai-assistant-hold-on-who-dug-the-hole-1ipl
Komunitas belajar opsional: https://t.me/GyaanSetuAi