𝗔𝗜 કોડ લખે છે. તે "પૂર્ણ" (Done) ને વ્યાખ્યાયિત કરી શકતું નથી.
મેં એક AI સ્લાઇડ ડેક જનરેટર બનાવ્યું છે. તમે વિષય ટાઈપ કરો છો અને તમને પ્રેઝન્ટેશન મળે છે.
AI ડેમો તરત જ કામ કરતો હતો. તેણે આઉટલાઇન લખી. તેણે સ્લાઇડ્સ બનાવી. તેણે ફાઇલ એક્સપોર્ટ કરી. મારી સ્ક્રીન પર, તે પૂર્ણ થયેલું લાગતું હતું.
તે પૂર્ણ થયું નહોતું.
AI એ સાબિત કર્યું કે એક યુઝર એક સમયે એક ડેક બનાવી શકે છે. અસલી પ્રોડક્ટ અલગ હોય છે. તેને એકસાથે 100 યુઝર્સને હેન્ડલ કરવાની જરૂર છે. તેણે તેમને યોગ્ય રીતે બિલિંગ કરવું જોઈએ. જ્યારે કોઈ સ્ટેપ નિષ્ફળ જાય ત્યારે તેને રિકવર કરવું જોઈએ. તેણે એવી ફાઇલ એક્સપોર્ટ કરવી જોઈએ જે ખરેખર PowerPoint માં ખુલે.
AI એ આ વસ્તુઓ ઉમેરી નહીં કારણ કે મેં તેને કહ્યું નહોતું.
જ્યારે તમે AI સાથે કંઈક બનાવો છો, ત્યારે અઘરો ભાગ ફીચરનું વર્ણન કરવાનું નથી. અઘરો ભાગ એ વ્યાખ્યાયિત કરવાનો છે કે "પૂર્ણ" (done) નો અર્થ શું છે.
મેં પાયા માટે Velobase Harness નો ઉપયોગ કર્યો. તેણે auth, payments, credits અને databases સંભાળ્યા. આનાથી મને AI ને ફક્ત PPT જનરેશન પર ધ્યાન કેન્દ્રિત કરવા દેવામાં મદદ મળી.
ત્યાં જ "પૂર્ણ લાગે છે" અને "પૂર્ણ છે" વચ્ચે તફાવત જોવા મળ્યો. મને ચાર મુખ્ય ખામીઓ મળી:
Concurrency: AI વિચારે છે કે એક સફળ રન એટલે પૂર્ણ થયેલું ફીચર. અસલી સિસ્ટમને કાર્યોને queues માં વિભાજિત કરવાની જરૂર છે. તમારે દરેક સ્લાઇડને તેના પોતાના જોબ તરીકે જનરેટ કરવી જોઈએ જેથી workers સ્કેલ કરી શકે.
Billing: AI એકવાર ક્રેડિટ્સ કાપી લેશે અને અટકી જશે. અસલી પ્રોડક્ટને state machine ની જરૂર છે. તમારે ક્રેડિટ્સ રિઝર્વ કરવા જોઈએ, વાસ્તવિક વપરાશના આધારે સેટલ કરવા જોઈએ, અને નિષ્ફળતા પર રિફંડ આપવું જોઈએ.
Self-review: જો backend કોઈ કાર્યને શાંતિથી ફરીથી પ્રયાસ (retry) કરે છે, તો યુઝરને માત્ર સ્પિનિંગ આઇકોન દેખાય છે. તમારે સ્ટેટસ બતાવવું જોઈએ. યુઝરે "checking" અથવા "redrawing" જોવું જોઈએ જેથી તેઓ જાણી શકે કે સિસ્ટમ કામ કરી રહી છે.
Export: એક સ્લાઇડ બ્રાઉઝરમાં સરસ દેખાઈ શકે છે પરંતુ PPTX ફાઇલમાં બગડી શકે છે. જરૂરિયાત માત્ર ફાઇલ બનાવવાની નથી. જરૂરિયાત એ છે કે ફાઇલ વેબ પ્રિવ્યુ સાથે મેળ ખાતી હોવી જોઈએ.
મેં મારી સૂચનાઓ બદલી નાખી. મેં AI ને ફીચર લિસ્ટ આપવાનું બંધ કર્યું. મેં તેને acceptance criteria આપવાનું શરૂ કર્યું.
AI માટે મારા નવા નિયમો:
- ડેમો નહીં, પણ production-ready SaaS બનાવો.
- 100 concurrent યુઝર્સને સપોર્ટ કરો.
- પ્લાનિંગ અને સ્લાઇડ ક્રિએશન માટે સ્વતંત્ર queues નો ઉપયોગ કરો.
- દરેક મોડેલ કોલને બિલિંગ સિસ્ટમ સાથે જોડો.
- ક્રેડિટ બેલેન્સના આધારે કાર્યોને pause અને resume કરો.
- દરેક સ્લાઇડ પછી layout checks ચલાવો.
- ખાતરી કરો કે PPTX એક્સપોર્ટ વિઝ્યુઅલ પ્રિવ્યુ સાથે મેળ ખાય છે.
- માત્ર સફળતા માટે જ નહીં, પણ concurrency અને નિષ્ફળતા માટે પણ ટેસ્ટ લખો.
AI ઝડપથી કોડ લખે છે. તે ફક્ત એટલું નથી જાણતું કે કોડને shippable શું બનાવે છે. તે લોકલ ડેમોને સંપૂર્ણ સિસ્ટમ માની લે છે.
માનવીય ભૂમિકા એન્જિનિયરિંગ સીમાઓ, નિષ્ફળતાના કિસ્સાઓ અને બિઝનેસ નિયમો પૂરા પાડવાની છે.
Harness SaaS પાયો પૂરો પાડે છે. AI લોજિક પૂરી પાડે છે. તમારે ફક્ત સૌથી સચોટ ઇનપુટ આપવાની જરૂર છે.
જો તમે AI દ્વારા નિર્મિત પ્રોડક્ટ લોન્ચ કરી હોય, તો "તે કામ કરે છે" અને "તે ગ્રાહકો માટે તૈયાર છે" વચ્ચેનો સૌથી મુશ્કેલ તફાવત કયો હતો?
સ્ત્રોત: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6