A Quorum Costume: Why Agent Verification Needs Fault Injection

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 வாரங்களுக்கு முன்2min read

A Quorum Costume: Why Agent Verification Needs Fault Injection

ஒரு போலி பெரும்பான்மைத் தோற்றம்: ஏஜென்ட் சரிபார்ப்பிற்கு ஏன் Fault Injection தேவைப்படுகிறது?

உங்கள் AI ஏஜென்ட் அதன் துல்லியம் குறித்து உங்களிடம் பொய் சொல்லக்கூடும்.

சமீபத்தில் ஒரு AI பார்ட்னர் தொடர்ந்து மூன்று முறை தோல்வியடைவதைக் கவனித்தேன். வெவ்வேறு தளங்களில் ஒரே உண்மைப் பிரச்சனையை அது கண்டறியத் தவறிவிட்டது. அது தவறான குரலில் (voice) எழுதியது. ஒரு ரிவியூவர் மாடல் (reviewer model) அதே பிழையைத் திரும்பத் திரும்பப் படித்தபோதும் அதற்கு அதிக மதிப்பீட்டையே வழங்கியது. உண்மை விலகல் (fact drift) குறித்த உண்மைகளைக் கூட அது தவறாக எண்ணியது.

நான் அந்தச் சுழற்சிக்கு (loop) வெளியே இருந்ததால் மட்டுமே இந்தத் தவறுகளைக் கண்டறிய முடிந்தது.

இது ஏஜென்ட் ஸ்டேக்கில் (agent stack) உள்ள ஒரு மிகப்பெரிய சிக்கலை வெளிப்படுத்துகிறது. பெரும்பாலான சரிபார்ப்பு அமைப்புகள் (verification systems) சுதந்திரமான செயல்பாட்டை (independence) அடிப்படையாகக் கொண்டவை என்று கருதுகின்றன. அவை மல்டி-ஏஜென்ட் வாக்களிப்பு (multi-agent voting), மேக்கர்/செக்கர் முறைகள் (maker/checker patterns), அல்லது என்க்செம்பிள் ப்ராம்ப்ட்களை (ensemble prompts) பயன்படுத்துகின்றன. வெவ்வேறு பாதைகள் வெவ்வேறு விஷயங்களைக் காணும் என்று அவை கருதுகின்றன.

ஆனால் பெரும்பாலும், இந்த பாதைகள் ஒரே மூலத்தைப் (source) பகிர்ந்து கொள்கின்றன.

ஒரு ரிவியூவர், எழுத்தாளரைப் போலவே ஒரே மூலத்திலிருந்து வாசிக்கும்போது, உங்களிடம் இரண்டு பார்வைகள் இல்லை. உங்களிடம் இரண்டு வெவ்வேறு தொப்பிகளில் இருக்கும் ஒரே ஒரு பார்வை மட்டுமே உள்ளது. இது ஒரு பெரும்பான்மைத் தோற்றத்தில் (quorum costume) மறைந்திருக்கும் ஒரு ஒற்றைப் புள்ளித் தோல்வி (single point of failure) ஆகும்.

பாதைகள் ஒரு மேல்நிலை மூலத்தைப் (upstream) பகிர்ந்து கொண்டால், அவை ஒரே தவறான உண்மை அல்லது ஒரே மாயத்தோற்றத்தில் (hallucination) உடன்படும். வெளியீடுகள் மாறுபட்டதாகத் தெரிவதால் அமைப்பு ஆரோக்கியமாகத் தோன்றலாம், ஆனால் மூலமே பொய் சொல்லும்போதெல்லாம் அது தோல்வியடைகிறது.

இதைச் சரிசெய்ய, நீங்கள் Fault Injection முறையைப் பயன்படுத்த வேண்டும்.

ஏஜென்ட்கள் உடன்படவில்லை என்பதை மட்டும் அளவிடாதீர்கள். அமைப்பின் ஒரு பகுதியைச் சிதைப்பதன் மூலம் அவர்களை உடன்படாமல் செய்ய உங்களால் முடியுமா என்பதை அளவிடுங்கள்.

உங்கள் ஸ்டேக்கை எவ்வாறு சோதிப்பது இதோ:

ஒரு தவறான நினைவைச் செலுத்துங்கள் (Inject a bad memory): ஒரு தரவு மீட்டெடுப்புப் பாதையில் (retrieval path) ஒரு போலி உண்மையைச் செலுத்துங்கள். இரண்டு பாதைகளும் அதே போலி உண்மையை வழங்கினால், உங்கள் பாதைகள் ஒன்றோடொன்று பிணைக்கப்பட்டுள்ளன (coupled).
ஒரு விதியை மாற்றியமைக்கவும் (Mutate a rule): ஆஃப்லைனில் ஒரு விதியை மாற்றவும். மேக்கரும் செக்கரும் ஒரு முரண்பாட்டைக் குறிப்பிடாமல் புதிய விதியைப் பின்பற்றினால், அவை ஒரு கேச்-ஐ (cache) பகிர்ந்து கொள்கின்றன என்று அர்த்தம்.
தவறான டெலிமெட்ரியைச் (telemetry) செலுத்துங்கள்: ஒரு போலி மாடல் ஐடியை (model ID) பதிவு செய்யுங்கள். சரிபார்ப்பு வெற்றியடைந்தால், சரிபார்ப்பவர் (verifier) எழுத்தாளரைப் போலவே அதே பதிவைப் படிக்கிறார் என்று அர்த்தம்.

விநியோகிக்கப்பட்ட அமைப்புகள் (Distributed systems) இதை பல ஆண்டுகளுக்கு முன்பே தீர்த்துவிட்டன. அவை கேயாஸ் இன்ஜினியரிங் (chaos engineering) மற்றும் பார்ட்டிஷன் சோதனைகளைப் (partition tests) பயன்படுத்துகின்றன. அமைப்பு நன்றாக இயங்குவதைப் பார்ப்பதன் மூலம் அவை அமைப்பை நம்புவதில்லை. தோல்வியைத் தூண்டுவதன் மூலம் அவை அதை நம்புகின்றன.

ஏஜென்ட் கட்டமைப்புகள் (Agent architectures) இந்த ஒழுக்கத்தைப் பின்பற்ற வேண்டும்.

சுதந்திரம் (Independence) என்பது நீங்கள் ஒருமுறை மட்டும் நிலைநிறுத்த வேண்டிய பண்பு அல்ல. அது நீங்கள் தொடர்ந்து மறுசரிபார்ப்பு செய்ய வேண்டிய பண்பு. ஒரு பகிரப்பட்ட கேச் அல்லது ஒரு மாடல் அப்டேட் உங்கள் சுதந்திரத்தை ஒரே இரவில்ச் சிதைத்துவிடக்கூடும்.

ஒருமனதான வாக்குகளை நம்புவதை நிறுத்துங்கள். பிழைகளைச் செலுத்தத் (injecting faults) தொடங்குங்கள்.

Source: https://dev.to/jugeni/a-quorum-costume-why-agent-verification-needs-fault-injection-kbh

Optional learning community: https://t.me/GyaanSetuAi

A Quorum Costume: Why Agent Verification Needs Fault Injection

Continue reading

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻’𝘁 𝗝𝘂𝘀𝘁 𝗛𝗮𝗰𝗸. 𝗧𝗵𝗲𝘆 𝗖𝗵𝗲𝗮𝘁 𝗧𝗵𝗲𝗺𝘀𝗲𝗹𝘃𝗲𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀𝗻'𝘁 𝗕𝗿𝗼𝗸𝗲𝗻. 𝗬𝗼𝘂𝗿 𝗖𝗼𝗺𝗽𝗮𝗻𝘆'𝘀 𝗧𝗿𝘂𝘁𝗵 𝗜𝘀.

𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗖𝗵𝗲𝗰𝗸𝗲𝗱 𝗘𝘃𝗲𝗿𝘆𝘁𝗵𝗶𝗻𝗴. 𝗜𝘁 𝗪𝗮𝘀 𝗦𝘁𝗶𝗹𝗹 𝗪𝗿𝗼𝗻𝗴.

Building An AI Agent Playground Before Production