𝗕𝗿𝗲𝗮𝗸𝗶𝗻𝗴 𝗕𝘂𝗶𝗹𝗱: 𝗜𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻 மற்றும் 𝗜𝗻𝘁𝗲𝗻𝘁𝗶𝗼𝗻 இடையிலான இடைவெளி

AI ஏஜெண்டுகள் நான் கேட்டதை அப்படியே செய்தன. ஆனால் நான் விரும்பியதைச் செய்யவில்லை.

நான் AI ஏஜெண்டுகளைக் கொண்டு உருவாக்குகிறேன். நான் வழிநடத்துகிறேன், அவை உருவாக்குகின்றன. ஒரு ஏஜென்ட் உள்கட்டமைப்பை (infrastructure) எழுதுகிறது. மற்றொன்று அதைச் சரிபார்க்கிறது (audit). நான் குறியீட்டை (code) இணைக்கிறேன். இது வேகமானது. இது சிறப்பானது. ஆனால் இதில் ஏற்படும் தோல்வி முறை விசித்திரமானது.

ஏஜெண்டுகள் தவறுகள் செய்வதில்லை. அவை அறிவுறுத்தல்களைத் துல்லியமாகப் பின்பற்றுகின்றன. எனது அறிவுறுத்தலுக்கும் எனது நோக்கத்திற்கும் இடையிலான இடைவெளியில்தான் பிழை (bug) உள்ளது. அந்த இடைவெளியை ஏஜென்ட் வார்த்தைக்கு வார்த்தை உண்மையாக நிரப்புகிறது.

ஒரு வாரத்தில் நான் இதை நான்கு முறை சந்தித்தேன்:

  • The Ghost Deployment: எனது deploy pipeline "success" என்று கூறியது. அது உண்மையாகவே நடந்தது. ஆனால் அது மே மாதத்தைச் சேர்ந்த பழைய பதிப்பை (version) மட்டுமே deploy செய்தது. அது deploy ஆகிவிட்டதா என்று நான் கேட்டேன். அது ஆம் என்று கூறியது. ஆனால் நான் உண்மையில் எழுதிய குறியீட்டை (code) அது deploy செய்ததா என்று கேட்க மறந்துவிட்டேன்.
  • The Empty Tabs: எனது UI மூன்று டேப்களைக் (tabs) காட்டியது. விவரக்குறிப்பு (spec) மூன்று டேப்களைக் கோரியது. ஆனால் நான் அவற்றை முழுமையாக்காததால், இரண்டு டேப்கள் பயனற்றதாக இருந்தன. ஏஜென்ட் அந்த விவரக்குறிப்பின்படி UI-ஐ உருவாக்கியது, ஆனால் அந்த விவரக்குறிப்பு காலாவதியானது.
  • The Technical Wall: துல்லியமான முடிவுகளைக் கேட்டேன். ஏஜென்ட் எனக்குத் தொழில்நுட்பச் சொற்களை (technical jargon) வழங்கியது. அது சரியாக இருந்தது, ஆனால் எனது பயனர்களால் அதை வாசிக்க முடியவில்லை. நான் ஒரு மனிதனுக்காக அல்லாமல், ஒரு பொறியாளருக்காக உருவாக்கினேன்.
  • The Silent Failure: ஒரு social card route பூஜ்ஜிய பைட்டைக் கொண்ட (zero-byte) கோப்பை உருவாக்கியது. ஒரு காலியான எழுத்துருக் கோப்பு (empty font file) எந்தத் தவறுச் செய்தியையும் (error) காட்டவில்லை. குறியீடு தான் எதிர்பார்த்த தவறைச் சரிசெய்தது, ஆனால் உண்மையில் நடந்த தவறை அது கவனிக்கத் தவறிவிட்டது.

இவை ஒவ்வொன்றும் தனது சொந்தச் சோதனையில் வெற்றி பெற்றன. குறியீடு தொழில்நுட்ப ரீதியாகத் துல்லியமாக இருந்தது.

நான் "இது வேலை செய்கிறது" என்பதை மட்டுமே நம்பியிருந்தால், இந்த நான்கு தோல்விகளும் வெளியாவன (shipped).

இதற்குத் தீர்வு சிறந்த prompting அல்ல. இது ஒரு புத்திசாலித்தனமான ஏஜென்ட் அல்ல. இது மனித மேற்பார்வை (human oversight).

ஏஜெண்டுகள் நீங்கள் சொல்வதற்கே முன்னுரிமை அளிக்கின்றன. நீங்கள் என்ன சொன்னீர்கள் என்பதை நீங்கள் என்ன சொல்ல விரும்பினீர்கள் என்பதோடு ஒப்பிட்டுச் சரிபார்ப்பதே உங்கள் வேலை. ஏஜென்ட்டினால் அந்த வித்தியாசத்தைக் காண முடியாது. உங்களால் மட்டுமே அதைச் செய்ய முடியும்.

வழிகாட்டுதல் என்பது ஒருமுறை கொடுக்கும் கட்டளை அல்ல. அது உங்கள் இலக்குடன் வேலையைத் தொடர்ந்து ஒப்பிட்டுப் பார்க்கும் ஒரு செயல்முறை. "இது இயங்கியதா?" என்று கேட்பதற்குப் பதிலாக, "இது நான் விரும்பிய விஷயமா?" என்று நீங்கள் கேட்க வேண்டும்.

ஏஜெண்டுகள் வேலையைச் செய்கின்றன. மனிதர்கள் நோக்கத்தை வழங்குகிறார்கள்.

Source: https://dev.to/earlgreyhot1701d/breaking-build-kiro-and-claude-delivered-exactly-what-i-asked-and-it-wasnt-what-i-wanted-27l5

Optional learning community: https://t.me/GyaanSetuAi