𝗔𝗜 𝗪𝗿𝗶𝘁𝗲𝘀 𝗖𝗼𝗱𝗲. 𝗜𝘁 𝗖𝗮𝗻'𝘁 𝗗𝗲𝗳𝗶𝗻𝗲 "𝗗𝗼𝗻𝗲."
मैंने एक AI स्लाइड डेक जनरेटर बनाया। आप एक विषय टाइप करते हैं और आपको एक प्रेजेंटेशन मिल जाती है।
AI डेमो तुरंत काम कर गया। इसने एक रूपरेखा (outline) लिखी। इसने स्लाइड्स बनाईं। इसने एक फ़ाइल एक्सपोर्ट की। मेरी स्क्रीन पर, यह पूरा लग रहा था।
यह पूरा नहीं था।
AI ने यह साबित कर दिया कि एक उपयोगकर्ता एक बार में एक डेक बना सकता है। एक वास्तविक उत्पाद अलग होता है। इसे एक साथ 100 उपयोगकर्ताओं को संभालना पड़ता है। इसे उन्हें सही ढंग से बिल करना चाहिए। किसी चरण के विफल होने पर इसे रिकवर (recover) होना चाहिए। इसे ऐसी फ़ाइल एक्सपोर्ट करनी चाहिए जो वास्तव में PowerPoint में खुले।
AI ने ये चीजें इसलिए नहीं जोड़ीं क्योंकि मैंने उसे ऐसा करने के लिए नहीं कहा था।
जब आप AI के साथ निर्माण करते हैं, तो कठिन हिस्सा फीचर का वर्णन करना नहीं है। कठिन हिस्सा यह परिभाषित करना है कि "Done" का क्या अर्थ है।
मैंने आधार के लिए Velobase Harness का उपयोग किया। इसने auth, payments, credits और databases को संभाला। इससे मुझे AI को केवल PPT जनरेशन पर केंद्रित करने में मदद मिली।
यहीं पर "पूरा लग रहा है" और "पूरा हो गया है" के बीच अंतर आया। मुझे चार मुख्य कमियाँ (gaps) मिलीं:
Concurrency: AI सोचता है कि एक सफल रन का मतलब है एक पूरा फीचर। एक वास्तविक सिस्टम को कार्यों को क्यू (queues) में विभाजित करने की आवश्यकता होती है। आपको प्रत्येक स्लाइड को एक अलग जॉब के रूप में जनरेट करना चाहिए ताकि वर्कर्स स्केल (scale) कर सकें।
Billing: AI एक बार क्रेडिट काट देगा और रुक जाएगा। एक वास्तविक उत्पाद को state machine की आवश्यकता होती है। आपको क्रेडिट सुरक्षित (reserve) करने चाहिए, वास्तविक उपयोग के आधार पर सेटल करना चाहिए, और विफलता (failure) होने पर रिफंड करना चाहिए।
Self-review: यदि बैकएंड चुपचाप किसी कार्य को फिर से प्रयास (retry) करता है, तो उपयोगकर्ता को केवल एक घूमता हुआ आइकन (spinning icon) दिखाई देता है। आपको स्टेटस दिखाना चाहिए। उपयोगकर्ता को "checking" या "redrawing" दिखना चाहिए ताकि उन्हें पता चले कि सिस्टम काम कर रहा है।
Export: एक स्लाइड ब्राउज़र में बहुत अच्छी दिख सकती है लेकिन PPTX फ़ाइल में खराब हो सकती है। आवश्यकता केवल एक फ़ाइल बनाना नहीं है। आवश्यकता यह है कि फ़ाइल वेब प्रीव्यू (web preview) से मेल खानी चाहिए।
मैंने अपने निर्देश बदल दिए। मैंने AI को फीचर लिस्ट देना बंद कर दिया। मैंने उसे acceptance criteria देना शुरू कर दिया।
AI के लिए मेरे नए नियम:
- एक प्रोडक्शन-रेडी SaaS बनाएं, डेमो नहीं।
- 100 समवर्ती (concurrent) उपयोगकर्ताओं का समर्थन करें।
- प्लानिंग और स्लाइड निर्माण के लिए स्वतंत्र क्यू (queues) का उपयोग करें।
- हर मॉडल कॉल को बिलिंग सिस्टम से जोड़ें।
- क्रेडिट बैलेंस के आधार पर कार्यों को रोकें (pause) और फिर से शुरू (resume) करें।
- प्रत्येक स्लाइड के बाद लेआउट चेक चलाएं।
- सुनिश्चित करें कि PPTX एक्सपोर्ट विजुअल प्रीव्यू से मेल खाता हो।
- केवल सफलता के लिए नहीं, बल्कि concurrency और विफलता के लिए भी टेस्ट लिखें।
AI तेज़ी से कोड लिखता है। बस उसे यह नहीं पता कि कोड को 'shippable' क्या बनाता है। वह एक लोकल डेमो को ही पूरा सिस्टम मान लेता है।
मानव की भूमिका इंजीनियरिंग सीमाएं, विफलता के मामले और व्यावसायिक नियम निर्धारित करना है।
Harness SaaS आधार प्रदान करता है। AI लॉजिक को पूरा करता है। आपको बस सबसे सटीक इनपुट देने की आवश्यकता है।
यदि आपने कोई AI-निर्मित उत्पाद लॉन्च किया है, तो "यह काम करता है" और "यह ग्राहकों के लिए तैयार है" के बीच सबसे कठिन अंतर क्या था?
स्रोत: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6