𝗘𝘃𝗲𝗿 𝗕𝗲𝗲𝗻 𝗕𝘂𝗿𝗻𝗲𝗱 𝗯𝘆 𝗮𝗻 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁?

📅3 hours ago⏱2 min read

Pernahkah Anda Terjebak oleh Asisten AI?

AI mengatakan sebuah tugas telah selesai. Anda mempercayainya. Lalu Anda menghabiskan waktu berhari-hari untuk menyadari bahwa ia tidak pernah menyelesaikan pekerjaan tersebut.

Saya menyebut ini sebagai gap (celah). Ini adalah ruang antara apa yang dilaporkan AI dan apa yang sebenarnya terjadi.

Lubang itu bersembunyi di dalam celah tersebut. Terkadang AI yang bersalah. Terkadang saya yang bersalah. Terkadang aspek engineering yang bersalah.

Berikut adalah tiga contoh nyata:

Jebakan Provenance Saya meminta AI untuk memulihkan kode dari sebuah git branch. Ia mengatakan telah mengambilnya dari branch lain. Ternyata tidak. Ia sebenarnya menulis ulang kode tersebut secara manual.

Sebuah cherry-pick memiliki riwayat yang bisa Anda telusuri. Penulisan ulang manual adalah sebuah orphan. Terlihat benar, tetapi tidak memiliki silsilah. Ketika saya mendesak untuk mencari kebenaran, AI tersebut mengakuinya.

Pelajaran: Klaim provenance AI tidak dapat diandalkan. Jangan tanya apa yang telah ia lakukan. Lihatlah git history untuk melihat apa yang sebenarnya ia lakukan.

Jebakan Spot-Check Saya meminta AI untuk mengubah logika form. Ia berkata "selesai." Saya menghabiskan empat hari untuk melakukan debugging pada front end.

Sebuah diff baris demi baris menunjukkan bahwa ia mengubah empat dari lima scope. Saya melihat banyak perubahan kode dan berasumsi sisanya baik-baik saja. Otak saya mengisi kekosongan tersebut.

Semakin besar perubahannya, semakin dalam jebakannya. Perubahan besar meningkatkan rasa percaya diri Anda, sementara cakupan (coverage) aktual Anda justru menurun.

Pelajaran: Jangan sekadar memindai. Hitunglah. Jika Anda memiliki lima tugas, verifikasi kelima tugas tersebut satu per satu.

Jebakan Engineering Sebuah AI terjebak dalam sebuah loop. Saya pikir ia sedang berpikir mendalam, jadi saya menunggu. Ternyata ia hanya menghabiskan kuota API saya.

Model menghasilkan token. Ia tidak mengelola anggaran (budget). Kontrol loop, timeout, dan batas anggaran (budget caps) adalah bagian dari lapisan engineering.

Pelajaran: Setiap agen otomatis harus memiliki batasan langkah (step limits) dan batas anggaran (budget caps). Jangan mengandalkan model untuk menghentikan dirinya sendiri.

Kesimpulannya:

Kata-kata AI adalah kesaksian, bukan vonis.

Kesaksian adalah apa yang dikatakannya. Vonis adalah bukti fisik.

Jika ia berkata "diperbaiki," periksa diff-nya.
Jika ia berkata "diambil," periksa git log-nya.
Jika ia berkata "sedang berpikir," periksa penggunaan token-nya.

Kedewasaan bukanlah belajar untuk mempercayai AI. Melainkan belajar untuk selalu memperlakukan kata-katanya sebagai kesaksian.

Sumber: https://dev.to/chenghongm/ever-been-burned-by-your-ai-assistant-hold-on-who-dug-the-hole-1ipl

Komunitas belajar opsional: https://t.me/GyaanSetuAi

𝗘𝘃𝗲𝗿 𝗕𝗲𝗲𝗻 𝗕𝘂𝗿𝗻𝗲𝗱 𝗯𝘆 𝗮𝗻 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁?

Continue reading

AI Tidak Akan Menggantikan Anda, Tetapi Kebiasaan AI yang Buruk Akan

𝗔𝗜 𝗪𝗼𝗻’𝘁 𝗥𝗲𝗽𝗹𝗮𝗰𝗲 𝗬𝗼𝘂, 𝗕𝘂𝘁 𝗕𝗮𝗱 𝗔𝗜 𝗛𝗮𝗯𝗶𝘁𝘀 𝗪𝗶𝗹𝗹

Agen AI Tidak Hanya Meretas. Mereka Menipu Diri Sendiri

𝗧𝗵𝗲 𝗔𝗜 𝗦𝗸𝗶𝗹𝗹 𝗔𝘁𝗿𝗼𝗽𝗵𝘆 𝗧𝗿𝗮𝗽

𝗜𝘁 𝗪𝗮𝘀 𝗡𝗲𝘃𝗲𝗿 𝗔𝗯𝗼𝘂𝘁 𝗔𝗜