My Agent Reported 12. The Real Number Was 13.

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 வாரங்களுக்கு முன்2min read

My Agent Reported 12. The Real Number Was 13.

என் ஏஜென்ட் 12 என்று தெரிவித்தது. உண்மையான எண் 13.

நான் உள்ளூரிலேயே (locally) இயங்கும் ஒரு கோடிங் ஏஜென்ட்டை (coding agent) உருவாக்கி வருகிறேன். இது திட்டமிடலுக்கு Claude-ஐயும், குறியீடு உருவாக்கத்திற்கு (code generation) உள்ளூர் மாடல்களையும் பயன்படுத்துகிறது. சமீபத்தில், ஒரு எளிய பணியை - குறிப்பிட்ட லாக்ஸ்களை (logs) எண்ணுவதை - அந்த ஏஜென்ட்டிடம் ஒப்படைத்தேன்.

ஏஜென்ட் 12 என்று தெரிவித்தது. கைமுறையாக கணக்கு பார்ப்பது எனக்கு சோர்வாக இருந்ததால், அதை அப்படியே ஏற்றுக்கொண்டேன். பிறகு, எனது டெர்மினலில் (terminal) ஒரு கைமுறை சரிபார்ப்பைச் செய்தேன். உண்மையான எண்ணிக்கை 13 ஆக இருந்தது.

ஒரு பதிவு ஒழுங்கற்ற வடிவத்தில் இருந்ததால், ஏஜென்ட் அதைத் தவறவிட்டது. ஏஜென்ட் கற்பனையான தகவல்களைத் (hallucinating) தெரிவிக்கவில்லை. அது "கிட்டத்தட்ட சரியாக" இருந்தது. இதுதான் மிகவும் ஆபத்தான வகை தவறு. இது நம்புவதற்கு ஏற்றது போலத் தோன்றும்.

அதைவிட மோசமாக, இறுதிச் சுருக்க அளவீடு (summary metric) சரியாகத் தெரிந்தது. ரவுண்டிங் (rounding) மற்றும் குரூப்பிங் (grouping) நிலைகள் அந்தத் தவறை மறைத்துவிட்டன. நான் இறுதி அறிக்கையை மட்டும் பார்த்திருந்தால், எந்தத் தவறும் தெரியாமல் போயிருக்கும். ஆனால் மூலத் தரவு (raw data) தவறாக இருந்தது. உங்கள் மூல அளவீடு ஒருமுறை தவறாகிவிட்டால், எதிர்கால அறிக்கைகள் அனைத்தும் அந்தத் தவறைத் தாவிவிடும்.

நம்பிக்கை மற்றும் அளவீடு குறித்து நான் ஒரு கடினமான பாடத்தைக் கற்றுக்கொண்டேன்.

வேலையைச் செய்யும் அமைப்பே அந்த வேலையைத் தீர்மானிக்க அனுமதித்தால், உங்களுக்குப் பிரச்சனைதான். நீங்கள் தேர்வை எழுதுபவரையே தேர்வாணையராக மாற்றிவிட்டீர்கள். ஒரு நிகழ்தகவு மாதிரி (probabilistic model) ஒருபோதும் உங்கள் உண்மையான ஆதாரமாக மட்டும் இருக்கக்கூடாது.

நான் இப்போது இரண்டு புதிய விதிகளைப் பின்பற்றுகிறேன்:

ஒரு மனிதன் முதலில் தானியங்கி முறையை (automation) நேரில் பார்க்க வேண்டும். தானாகவே அளவிடும் ஒரு அமைப்பை நான் நம்புவதற்கு முன், நானே ஒரு தீர்மானிக்கப்பட்ட எண்ணிக்கையை (deterministic count) மேற்கொள்வேன். டெர்மினலில் எண்கள் வருவதை நான் கவனிப்பேன். பலமுறை இயக்கிய பிறகு, இயந்திரமும் மனிதனும் சரியாகப் பொருந்தும் போது மட்டுமே நான் இந்த விதியைத் தளர்த்துவேன்.
அளவீடுகளைக் காணக்கூடிய அலகுகளுடன் (observable units) இணைக்கவும். ஒரு மனிதனால் எதைப் பார்க்க முடியுமோ, அதைத்தான் ஏஜென்ட் துல்லியமாகக் கணக்கிடுவதை நான் உறுதி செய்கிறேன். தரவுகள் தெளிவற்றதாக இருந்தால், எண்கள் மாறிக்கொண்டே இருக்கும். தரவுகள் துல்லியமாக இருந்தால், நம்மால் முடிவுகளைச் சரியாக ஒப்பிட முடியும்.

இந்த அணுகுமுறை மெதுவானது. இது எப்போதும் எல்லையற்ற அளவில் விரிவடையாது (scale). ஆனால், இதன் மூலமே நீங்கள் நம்பிக்கையின் அடித்தளத்தை உருவாக்க முடியும்.

நீங்கள் AI-ஐக் கொண்டு குறியீடு எழுதலாம். AI-ஐக் கொண்டு பகுப்பாய்வு (analysis) செய்யலாம். ஆனால் முக்கியமான எண்களுக்கு, ஒரு தீர்மானிக்கப்பட்ட செயல்முறைதான் (deterministic process) இறுதிச் சாட்சியாக இருக்க வேண்டும்.

நீங்கள் எங்கே எல்லையை வகுப்பீர்கள்? ஒரு எண் கைமுறையாகச் சரிபார்க்கப்பட வேண்டிய அளவுக்கு முக்கியமானது என்று எப்போது முடிவு செய்வீர்கள்?

Source: https://dev.to/josephyeo/my-agent-reported-12-the-real-number-was-13-5864

Optional learning community: https://t.me/GyaanSetuAi

My Agent Reported 12. The Real Number Was 13.

Continue reading

𝗧𝗵𝗲 𝗡𝘂𝗹𝗹 𝗜𝗻𝗽𝘂𝘁 𝗧𝗵𝗮𝘁 𝗕𝗿𝗼𝗸𝗲 𝗠𝘆 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁

நாங்கள் மாதிரிகளை நம்புவதை நிறுத்தினோம். பிறகு எங்கள் சொந்த எண்களையும் நம்புவதை நிறுத்தினோம்.

AI ஏஜெண்டுகளைத் தயாரிப்பில் இயக்கும்போது நான் கற்றுக்கொண்டவை

தயாரிப்பு நிலை AI முகவர்களை உருவாக்க நான் பயன்படுத்தும் துல்லியமான தொழில்நுட்ப அடுக்கு

The Agentic Loop: A Practical Field Guide