ஒரு போலி பெரும்பான்மைத் தோற்றம்: ஏஜென்ட் சரிபார்ப்பிற்கு ஏன் Fault Injection தேவைப்படுகிறது?

உங்கள் AI ஏஜென்ட் அதன் துல்லியம் குறித்து உங்களிடம் பொய் சொல்லக்கூடும்.

சமீபத்தில் ஒரு AI பார்ட்னர் தொடர்ந்து மூன்று முறை தோல்வியடைவதைக் கவனித்தேன். வெவ்வேறு தளங்களில் ஒரே உண்மைப் பிரச்சனையை அது கண்டறியத் தவறிவிட்டது. அது தவறான குரலில் (voice) எழுதியது. ஒரு ரிவியூவர் மாடல் (reviewer model) அதே பிழையைத் திரும்பத் திரும்பப் படித்தபோதும் அதற்கு அதிக மதிப்பீட்டையே வழங்கியது. உண்மை விலகல் (fact drift) குறித்த உண்மைகளைக் கூட அது தவறாக எண்ணியது.

நான் அந்தச் சுழற்சிக்கு (loop) வெளியே இருந்ததால் மட்டுமே இந்தத் தவறுகளைக் கண்டறிய முடிந்தது.

இது ஏஜென்ட் ஸ்டேக்கில் (agent stack) உள்ள ஒரு மிகப்பெரிய சிக்கலை வெளிப்படுத்துகிறது. பெரும்பாலான சரிபார்ப்பு அமைப்புகள் (verification systems) சுதந்திரமான செயல்பாட்டை (independence) அடிப்படையாகக் கொண்டவை என்று கருதுகின்றன. அவை மல்டி-ஏஜென்ட் வாக்களிப்பு (multi-agent voting), மேக்கர்/செக்கர் முறைகள் (maker/checker patterns), அல்லது என்க்செம்பிள் ப்ராம்ப்ட்களை (ensemble prompts) பயன்படுத்துகின்றன. வெவ்வேறு பாதைகள் வெவ்வேறு விஷயங்களைக் காணும் என்று அவை கருதுகின்றன.

ஆனால் பெரும்பாலும், இந்த பாதைகள் ஒரே மூலத்தைப் (source) பகிர்ந்து கொள்கின்றன.

ஒரு ரிவியூவர், எழுத்தாளரைப் போலவே ஒரே மூலத்திலிருந்து வாசிக்கும்போது, உங்களிடம் இரண்டு பார்வைகள் இல்லை. உங்களிடம் இரண்டு வெவ்வேறு தொப்பிகளில் இருக்கும் ஒரே ஒரு பார்வை மட்டுமே உள்ளது. இது ஒரு பெரும்பான்மைத் தோற்றத்தில் (quorum costume) மறைந்திருக்கும் ஒரு ஒற்றைப் புள்ளித் தோல்வி (single point of failure) ஆகும்.

பாதைகள் ஒரு மேல்நிலை மூலத்தைப் (upstream) பகிர்ந்து கொண்டால், அவை ஒரே தவறான உண்மை அல்லது ஒரே மாயத்தோற்றத்தில் (hallucination) உடன்படும். வெளியீடுகள் மாறுபட்டதாகத் தெரிவதால் அமைப்பு ஆரோக்கியமாகத் தோன்றலாம், ஆனால் மூலமே பொய் சொல்லும்போதெல்லாம் அது தோல்வியடைகிறது.

இதைச் சரிசெய்ய, நீங்கள் Fault Injection முறையைப் பயன்படுத்த வேண்டும்.

ஏஜென்ட்கள் உடன்படவில்லை என்பதை மட்டும் அளவிடாதீர்கள். அமைப்பின் ஒரு பகுதியைச் சிதைப்பதன் மூலம் அவர்களை உடன்படாமல் செய்ய உங்களால் முடியுமா என்பதை அளவிடுங்கள்.

உங்கள் ஸ்டேக்கை எவ்வாறு சோதிப்பது இதோ:

  • ஒரு தவறான நினைவைச் செலுத்துங்கள் (Inject a bad memory): ஒரு தரவு மீட்டெடுப்புப் பாதையில் (retrieval path) ஒரு போலி உண்மையைச் செலுத்துங்கள். இரண்டு பாதைகளும் அதே போலி உண்மையை வழங்கினால், உங்கள் பாதைகள் ஒன்றோடொன்று பிணைக்கப்பட்டுள்ளன (coupled).
  • ஒரு விதியை மாற்றியமைக்கவும் (Mutate a rule): ஆஃப்லைனில் ஒரு விதியை மாற்றவும். மேக்கரும் செக்கரும் ஒரு முரண்பாட்டைக் குறிப்பிடாமல் புதிய விதியைப் பின்பற்றினால், அவை ஒரு கேச்-ஐ (cache) பகிர்ந்து கொள்கின்றன என்று அர்த்தம்.
  • தவறான டெலிமெட்ரியைச் (telemetry) செலுத்துங்கள்: ஒரு போலி மாடல் ஐடியை (model ID) பதிவு செய்யுங்கள். சரிபார்ப்பு வெற்றியடைந்தால், சரிபார்ப்பவர் (verifier) எழுத்தாளரைப் போலவே அதே பதிவைப் படிக்கிறார் என்று அர்த்தம்.

விநியோகிக்கப்பட்ட அமைப்புகள் (Distributed systems) இதை பல ஆண்டுகளுக்கு முன்பே தீர்த்துவிட்டன. அவை கேயாஸ் இன்ஜினியரிங் (chaos engineering) மற்றும் பார்ட்டிஷன் சோதனைகளைப் (partition tests) பயன்படுத்துகின்றன. அமைப்பு நன்றாக இயங்குவதைப் பார்ப்பதன் மூலம் அவை அமைப்பை நம்புவதில்லை. தோல்வியைத் தூண்டுவதன் மூலம் அவை அதை நம்புகின்றன.

ஏஜென்ட் கட்டமைப்புகள் (Agent architectures) இந்த ஒழுக்கத்தைப் பின்பற்ற வேண்டும்.

சுதந்திரம் (Independence) என்பது நீங்கள் ஒருமுறை மட்டும் நிலைநிறுத்த வேண்டிய பண்பு அல்ல. அது நீங்கள் தொடர்ந்து மறுசரிபார்ப்பு செய்ய வேண்டிய பண்பு. ஒரு பகிரப்பட்ட கேச் அல்லது ஒரு மாடல் அப்டேட் உங்கள் சுதந்திரத்தை ஒரே இரவில்ச் சிதைத்துவிடக்கூடும்.

ஒருமனதான வாக்குகளை நம்புவதை நிறுத்துங்கள். பிழைகளைச் செலுத்தத் (injecting faults) தொடங்குங்கள்.

Source: https://dev.to/jugeni/a-quorum-costume-why-agent-verification-needs-fault-injection-kbh

Optional learning community: https://t.me/GyaanSetuAi