Ciri AI Memerlukan Sempadan Produk, Bukan Sekadar Prompt yang Lebih Baik
Kebanyakan ciri AI gagal.
Ia bukan gagal kerana modelnya lemah. Ia gagal kerana pembangun melayan segala-galanya di sekeliling model tersebut seperti sebuah demo.
Baru-baru ini saya mengusahakan sebuah aplikasi senaman iOS. Ia menggunakan Claude untuk pelan senaman. Bahagian model itu mudah. Anda hantar konteks dan dapat semula pelan tersebut.
Kerja keras yang sebenar adalah apa yang menjadikannya sebuah produk yang nyata. Anda mesti mengendalikan:
• Baki kredit AI bulanan • Mod luar talian • Penyimpanan token pengesahan (auth token) • Keadaan pemuatan (loading states) semasa penjanaan • Peraturan berbeza untuk menambah berbanding menukar senaman • Ujian untuk kes-kes hujung (edge cases) yang membosankan
Di sinilah letaknya kualiti.
Sebuah butang tidak seharusnya sekadar memanggil satu endpoint. Ia mesti tahu sama ada sesuatu cadangan itu dibenarkan. Ia perlu menyemak sama ada pengguna sedang dalam talian. Ia perlu menyemak sama ada mereka masih mempunyai baki kredit.
Model tidak peduli tentang perkara-perkara ini. Pengguna yang peduli.
Apabila AI memberi maklum balas, ia mesti menyertakan jumlah kredit yang telah dikemas kini. UI mesti dikemas kini dengan serta-merta. Ini menghalang pengguna daripada melihat data yang lapuk. Jika backend menyatakan mereka telah menggunakan satu kredit, UI mesti menunjukkannya sekarang.
Saya menulis 13 ujian untuk satu view model. Saya menguji had kredit dan ralat luar talian. Ini bukan untuk suka-suka. Ini kerana perkara-perkara sebegini akan rosak di hadapan pengguna sebenar.
Kegagalan sambungan mesti mempunyai mesej yang jelas. Jangan katakan "unexpected server response." Katakan "Anda sedang luar talian. Sambung semula untuk menggunakan ciri AI."
Melancarkan ciri AI adalah kejuruteraan perisian biasa dengan kebergantungan probabilistik di tengah-tengahnya.
Fokus pada kontrak di sekeliling model:
• Bolehkah pengguna menggunakannya sekarang? • Apa yang berlaku jika rangkaian terputus? • Adakah penggunaan dijejak dengan betul? • Adakah UI mencerminkan keadaan pelayan? • Bolehkah anda menguji kes-kes hujung (edge cases) tanpa model tersebut?
Sebaik sahaja anda membetulkan perkara ini, ciri tersebut tidak lagi terasa seperti sekadar prompt pada sebuah butang. Ia mula terasa seperti sebahagian daripada aplikasi anda.
Jangan tanya sama ada model itu menjawab. Tanya sama ada ciri tersebut mampu bertahan dalam kehidupan sebenar.
Sumber: https://dev.to/toddssullivan/ai-features-need-product-edges-not-just-better-prompts-18k
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
