𝗔𝗜 𝗠𝗲𝗻𝘂𝗹𝗶𝘀 𝗞𝗼𝗱. 𝗜𝗮 𝗧𝗶𝗱𝗮𝗸 𝗕𝗼𝗹𝗲𝗵 𝗠𝗲𝗻𝗲𝘁𝗮𝗽𝗸𝗮𝗻 "𝗦𝗲𝗹𝗲𝘀𝗮𝗶."

Saya membina penjana slaid AI. Anda taip satu topik dan dapatkan pembentangan.

Demo AI tersebut berfungsi serta-merta. Ia menulis rangka kerja. Ia membuat slaid. Ia mengeksport fail. Pada skrin saya, ia kelihatan sudah selesai.

Ia belum selesai.

AI tersebut membuktikan bahawa seorang pengguna boleh membuat satu set slaid sekali sahaja. Produk sebenar adalah berbeza. Ia perlu mengendalikan 100 pengguna pada satu masa. Ia mesti mengebil mereka dengan betul. Ia mesti pulih apabila sesuatu langkah gagal. Ia mesti mengeksport fail yang benar-benar boleh dibuka dalam PowerPoint.

AI tersebut tidak menambah perkara-perkara ini kerana saya tidak menyuruhnya.

Apabila anda membina menggunakan AI, bahagian yang sukar bukanlah menerangkan ciri tersebut. Bahagian yang sukar adalah menentukan apa maksud "selesai".

Saya menggunakan Velobase Harness sebagai asas. Ia mengendalikan auth, pembayaran, kredit, dan pangkalan data. Ini membolehkan saya memfokuskan AI kepada penjanaan PPT itu sendiri.

Di situlah perbezaan antara "kelihatan selesai" dan "benar-benar selesai" muncul. Saya menemui empat jurang utama:

  • Keserentakan (Concurrency): AI berfikir satu larian yang berjaya bersamaan dengan ciri yang sudah siap. Sistem sebenar perlu membahagikan tugasan kepada barisan (queues). Anda mesti menjana setiap slaid sebagai tugasan tersendiri supaya pekerja (workers) boleh diskalakan.

  • Pengebilan (Billing): AI akan menolak kredit sekali sahaja dan berhenti. Produk sebenar memerlukan mesin keadaan (state machine). Anda mesti menempah kredit, menyelesaikan berdasarkan penggunaan sebenar, dan memulangkan semula (refund) jika berlaku kegagalan.

  • Semakan kendiri (Self-review): Jika backend mencuba semula tugasan secara senyap, pengguna hanya akan melihat ikon berpusing. Anda mesti menunjukkan status. Pengguna sepatutnya melihat "sedang menyemak" atau "sedang melukis semula" supaya mereka tahu sistem sedang berfungsi.

  • Eksport (Export): Slaid mungkin kelihatan hebat dalam pelayar web tetapi rosak dalam fail PPTX. Keperluannya bukan sekadar membuat fail. Keperluannya adalah fail tersebut mestilah sepadan dengan pratonton web.

Saya mengubah arahan saya. Saya berhenti memberikan senarai ciri kepada AI. Saya mula memberikannya kriteria penerimaan (acceptance criteria).

Peraturan baharu saya untuk AI:

  • Bina SaaS yang sedia untuk produksi, bukan sekadar demo.
  • Sokong 100 pengguna serentak.
  • Gunakan barisan (queues) bebas untuk perancangan dan penciptaan slaid.
  • Sambungkan setiap panggilan model ke sistem pengebilan.
  • Jeda dan sambung semula tugasan berdasarkan baki kredit.
  • Jalankan semakan susun atur selepas setiap slaid.
  • Pastikan eksport PPTX sepadan dengan pratonton visual.
  • Tulis ujian untuk keserentakan dan kegagalan, bukan sekadar kejayaan.

AI menulis kod dengan pantas. Ia cuma tidak tahu apa yang menjadikan kod itu boleh dihantar (shippable). Ia menganggap demo tempatan sebagai satu sistem yang lengkap.

Peranan manusia adalah untuk menyediakan sempadan kejuruteraan, kes kegagalan, dan peraturan perniagaan.

Harness menyediakan asas SaaS. AI melengkapkan logik tersebut. Anda hanya perlu memberikan input yang paling tepat.

Jika anda melancarkan produk yang dibina oleh AI, apakah jurang yang paling sukar antara "ia berfungsi" dan "ia sedia untuk pelanggan"?

Sumber: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6