બ્રેકિંગ બિલ્ડ: સૂચના અને ઈરાદા વચ્ચેનો તફાવત

AI એજન્ટોએ બરાબર એ જ કર્યું જે મેં કહ્યું હતું. તેમણે એ નથી કર્યું જે હું ઈચ્છતો હતો.

હું AI એજન્ટો સાથે કામ કરું છું. હું માર્ગદર્શન આપું છું, અને તેઓ જનરેટ કરે છે. એક એજન્ટ ઇન્ફ્રાસ્ટ્રક્ચર લખે છે. બીજો તેનું ઓડિટ કરે છે. હું કોડ મર્જ કરું છું. તે ઝડપી છે. તે સારું છે. પરંતુ નિષ્ફળતાની રીત વિચિત્ર છે.

એજન્ટો ભૂલો કરતા નથી. તેઓ સૂચનાઓનું સંપૂર્ણ પાલન કરે છે. બગ (bug) મારી સૂચના અને મારા ઈરાદા વચ્ચેના તફાવતમાં રહેલો છે. એજન્ટ તે તફાવતને શાબ્દિક સત્યથી ભરી દે છે.

મેં એક અઠવાડિયામાં ચાર વાર આ અનુભવ્યું:

  • ધ ગોસ્ટ ડિપ્લોયમેન્ટ (The Ghost Deployment): મારી ડિપ્લોય પાઇપલાઇને "સફળતા" (success) દર્શાવી. તે સફળ હતી. પરંતુ તેણે મે મહિનાનું જૂનું વર્ઝન ડિપ્લોય કરી દીધું. મેં પૂછ્યું કે શું તે ડિપ્લોય થયું? તે થયું હતું. હું એ પૂછવાનું ભૂલી ગયો કે શું તેણે તે કોડ ડિપ્લોય કર્યો જે મેં ખરેખર લખ્યો હતો.
  • ધ એમ્પટી ટેબ્સ (The Empty Tabs): મારા UI માં ત્રણ ટેબ્સ દેખાતા હતા. સ્પેસિફિકેશન (spec) મુજબ ત્રણ ટેબ્સ જરૂરી હતા. બે ટેબ્સ ડેડ એન્ડ (dead end) પર લઈ જતા હતા કારણ કે મેં તે ક્યારેય પૂરા કર્યા નહોતા. એજન્ટે સ્પેસિફિકેશન મુજબ UI બનાવ્યું, પરંતુ સ્પેસિફિકેશન જૂનું હતું.
  • ધ ટેકનિકલ વોલ (The Technical Wall): મેં સચોટ તારણો (findings) માંગ્યા હતા. એજન્ટે મને ટેકનિકલ શબ્દાવલિ (jargon) આપી. તે સાચું હતું, પરંતુ મારા વપરાશકર્તાઓ તેને વાંચી શકતા નહોતા. મેં એન્જિનિયર માટે બનાવ્યું હતું, માણસ માટે નહીં.
  • ધ સાયલન્ટ ફેઈલ્યોર (The Silent Failure): એક સોશિયલ કાર્ડ રૂટે ઝીરો-બાઇટ ફાઇલ બનાવી. એક ખાલી ફોન્ટ ફાઇલે કોઈ એરર (error) ટ્રિગર કરી નહોતી. કોડે તે એરર હેન્ડલ કરી જેની તેણે અપેક્ષા રાખી હતી, પરંતુ જે એરર ખરેખર બની હતી તે તે ચૂકી ગયું.

આમાંનું દરેક પોતાનું ટેસ્ટ પાસ કરી ગયું હતું. કોડ ટેકનિકલ રીતે સંપૂર્ણ હતો.

જો મેં ફક્ત "તે કામ કરે છે" (it works) પર જ વિશ્વાસ કર્યો હોત, તો આ ચારેય નિષ્ફળતાઓ શિપ (ship) થઈ ગઈ હોત.

ઉકેલ વધુ સારું પ્રોમ્પ્ટિંગ (prompting) નથી. તે સ્માર્ટ એજન્ટ નથી. તે માનવીય દેખરેખ (human oversight) છે.

એજન્ટો તમે જે કહો છો તેના માટે ઓપ્ટિમાઇઝ થાય છે. તમારું કામ એ તપાસવાનું છે કે તમે જે કહ્યું તે તમે જે કહેવા માંગતા હતા તેની સામે યોગ્ય છે કે નહીં. એજન્ટ તફાવત જોઈ શકતો નથી. તમે એકલા જ તે કરી શકો છો.

દિશા આપવી એ એક વખતનો કમાન્ડ નથી. તે તમારા લક્ષ્ય સામે કામને સતત ચકાસવાની પ્રક્રિયા છે. તમારે "શું તે ચાલ્યું?" ને બદલે "શું આ એ જ છે જે હું ઈચ્છતો હતો?" એમ પૂછવું જોઈએ.

એજન્ટો કામ કરે છે. માણસો ઈરાદો પૂરો પાડે છે.

Source: https://dev.to/earlgreyhot1701d/breaking-build-kiro-and-claude-delivered-exactly-what-i-asked-and-it-wasnt-what-i-wanted-27l5

Optional learning community: https://t.me/GyaanSetuAi