A Quorum Costume: Why Agent Verification Needs Fault Injection

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 ആഴ്ച മുമ്പ്2min read

A Quorum Costume: Why Agent Verification Needs Fault Injection

ഒരു ക്വോറം വേഷം: ഏജന്റ് വെരിഫിക്കേഷന് എന്തുകൊണ്ട് ഫോൾട്ട് ഇൻജക്ഷൻ ആവശ്യമാണ്

നിങ്ങളുടെ AI ഏജന്റ് അതിന്റെ കൃത്യതയെക്കുറിച്ച് നിങ്ങളോട് കള്ളം പറഞ്ഞേക്കാം.

അടുത്തിടെ ഒരു AI പാർട്ണർ തുടർച്ചയായി മൂന്ന് തവണ പരാജയപ്പെടുന്നത് ഞാൻ കണ്ടു. വ്യത്യസ്ത സാഹചര്യങ്ങളിൽ ഒരേ സത്യസന്ധതയുമായി ബന്ധപ്പെട്ട പ്രശ്നം അത് വീണ്ടും വീണ്ടും വരുത്തിത്തീർത്തു. അത് തെറ്റായ ശൈലിയിലാണ് എഴുതിയത്. ഒരേ തെറ്റ് തന്നെ വായിക്കുമ്പോഴും ഒരു റിവ്യൂവർ മോഡൽ അതിന് ഉയർന്ന റേറ്റിംഗ് നൽകിക്കൊണ്ടിരുന്നു. 'ഫാക്ട് ഡ്രിഫ്റ്റിനെ' (fact drift) കുറിച്ചുള്ള വസ്തുതകൾ പോലും അത് തെറ്റായി കണക്കാക്കി.

ഞാൻ ആ പ്രക്രിയയ്ക്ക് പുറത്തുനിന്നുകൊണ്ട് നിരീക്ഷിച്ചതുകൊണ്ട് മാത്രമാണ് ഈ തെറ്റുകൾ തിരിച്ചറിഞ്ഞത്.

ഇത് ഏജന്റ് സ്റ്റാക്കിലെ (agent stack) വലിയൊരു പ്രശ്നം വെളിപ്പെടുത്തുന്നു. മിക്ക വെരിഫിക്കേഷൻ സിസ്റ്റങ്ങളും സ്വതന്ത്രമായ പ്രവർത്തനത്തെയാണ് (independence) മുൻനിർത്തി പ്രവർത്തിക്കുന്നത്. അവ മൾട്ടി-ഏജന്റ് വോട്ടിംഗ്, മേക്കർ/ചെക്കർ പാറ്റേണുകൾ, അല്ലെങ്കിൽ എൻസെംബിൾ പ്രോംപ്റ്റുകൾ എന്നിവ ഉപയോഗിക്കുന്നു. വ്യത്യസ്ത പാതകൾ വ്യത്യസ്ത കാര്യങ്ങൾ കാണുമെന്ന് അവ കരുതുന്നു.

എന്നാൽ പലപ്പോഴും, ഈ പാതകൾ ഒരേ സ്രോതസ്സാണ് (source) പങ്കിടുന്നത്.

ഒരു റൈറ്റർ ഉപയോഗിക്കുന്ന അതേ സ്രോതസ്സിൽ നിന്നാണ് ഒരു റിവ്യൂവർ വായിക്കുന്നതെങ്കിൽ, അവിടെ നിങ്ങൾക്ക് രണ്ട് കാഴ്ചപ്പാടുകൾ ലഭിക്കുന്നില്ല. പകരം, രണ്ട് വ്യത്യസ്ത വേഷങ്ങൾ ധരിച്ച ഒരൊറ്റ കാഴ്ചപ്പാട് മാത്രമേ നിങ്ങൾക്കുണ്ടാവൂ. ഇത് ഒരു ക്വോറം വേഷം ധരിച്ച 'സിംഗിൾ പോയിന്റ് ഓഫ് ഫെയിലർ' (single point of failure) ആണ്.

പാതകൾ ഒരേ അപ്‌സ്ട്രീം (upstream) പങ്കിടുന്നുണ്ടെങ്കിൽ, അവ ഒരേ തെറ്റായ വസ്തുതയിലോ അല്ലെങ്കിൽ ഒരേ ഹാലൂസിനേഷനിലോ (hallucination) യോജിക്കും. ഔട്ട്‌പുട്ടുകൾ വൈവിധ്യമാർന്നതായി തോന്നുന്നതുകൊണ്ട് സിസ്റ്റം ആരോഗ്യകരമാണെന്ന് തോന്നും, എന്നാൽ സ്രോതസ്സ് കള്ളം പറയുമ്പോഴെല്ലാം അത് പരാജയപ്പെടുന്നു.

ഇത് പരിഹരിക്കാൻ, നിങ്ങൾ ഫോൾട്ട് ഇൻജക്ഷൻ (fault injection) ഉപയോഗിക്കണം.

ഏജന്റുകൾ തമ്മിൽ വിയോജിപ്പുണ്ടോ എന്ന് മാത്രം പരിശോധിക്കരുത്. സിസ്റ്റത്തിന്റെ ഒരു ഭാഗം തകരാറിലാക്കി അവരെ വിയോജിപ്പിക്കാൻ നിങ്ങൾക്ക് കഴിയുമോ എന്ന് പരിശോധിക്കുക.

നിങ്ങളുടെ സ്റ്റാക്ക് എങ്ങനെ പരിശോധിക്കാം എന്ന് ഇതാ:

ഒരു മോശം മെമ്മറി ഇൻജക്ട് ചെയ്യുക: ഒരു റിട്രീവൽ പാത്തിൽ (retrieval path) ഒരു വ്യാജ വസ്തുത നൽകുക. രണ്ട് പാതകളും ആ വ്യാജ വസ്തുത തന്നെ നൽകുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ പാതകൾ പരസ്പരം ബന്ധിക്കപ്പെട്ടിരിക്കുന്നു (coupled).
ഒരു നിയമം മാറ്റുക: ഓഫ്‌ലൈനായി ഒരു നിയമം മാറ്റുക. മേക്കറും ചെക്കറും ഒരു വൈരുദ്ധ്യം ചൂണ്ടിക്കാണിക്കാതെ പുതിയ നിയമം തന്നെ പിന്തുടരുകയാണെങ്കിൽ, അവർ ഒരു കാഷെ (cache) പങ്കിടുന്നു എന്നാണ് അർത്ഥം.
തെറ്റായ ടെലിമെട്രി നൽകുക: ഒരു വ്യാജ മോഡൽ ഐഡി (model ID) രേഖപ്പെടുത്തുക. പരിശോധന വിജയിക്കുകയാണെങ്കിൽ, വെരിഫയർ റൈറ്റർ ഉപയോഗിക്കുന്ന അതേ റെക്കോർഡ് തന്നെയാണ് വായിക്കുന്നത്.

ഡിസ്ട്രിബ്യൂട്ടഡ് സിസ്റ്റങ്ങൾ (Distributed systems) വർഷങ്ങൾക്ക് മുമ്പ് തന്നെ ഇത് പരിഹരിച്ചിട്ടുണ്ട്. അവ കയോസ് എൻജിനീയറിംഗും (chaos engineering) പാർട്ടീഷൻ ടെസ്റ്റുകളും ഉപയോഗിക്കുന്നു. സിസ്റ്റം നന്നായി പ്രവർത്തിക്കുന്നത് കണ്ടു അവ സിസ്റ്റത്തെ വിശ്വസിക്കുന്നില്ല. പരാജയങ്ങൾ വരുത്തിക്കൊണ്ട് (inducing failure) അവ സിസ്റ്റത്തെ വിശ്വസിക്കുന്നു.

ഏജന്റ് ആർക്കിടെക്ചറുകൾ ഈ രീതി അവലംബിക്കണം.

സ്വതന്ത്രത്വം (Independence) എന്നത് ഒരിക്കൽ മാത്രം സ്ഥാപിച്ചെടുക്കേണ്ട ഒന്നല്ല. അത് നിരന്തരം വീണ്ടും പരിശോധിക്കേണ്ട ഒന്നാണ്. ഒരു ഷെയർഡ് കാഷെയോ മോഡൽ അപ്‌ഡേറ്റോ നിങ്ങളുടെ സ്വതന്ത്രത്വത്തെ ഒറ്റരാത്രികൊണ്ട് തകർത്തേക്കാം.

ഐകകണ്ഠ്യമായ വോട്ടുകളെ വിശ്വസിക്കുന്നത് നിർത്തുക. ഫോൾട്ടുകൾ ഇൻജക്ട് ചെയ്യാൻ തുടങ്ങുക.

Source: https://dev.to/jugeni/a-quorum-costume-why-agent-verification-needs-fault-injection-kbh

Optional learning community: https://t.me/GyaanSetuAi

A Quorum Costume: Why Agent Verification Needs Fault Injection

Continue reading

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

AI ഏജന്റുകൾ വെറുതെ ഹാക്ക് ചെയ്യുക മാത്രമല്ല ചെയ്യുന്നത്, അവ സ്വയം വഞ്ചിക്കുകയും ചെയ്യുന്നു

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀𝗻'𝘁 𝗕𝗿𝗼𝗸𝗲𝗻. 𝗬𝗼𝘂𝗿 𝗖𝗼𝗺𝗽𝗮𝗻𝘆'𝘀 𝗧𝗿𝘂𝘁𝗵 𝗜𝘀.

നിങ്ങളുടെ ഏജന്റ് എല്ലാം പരിശോധിച്ചു, എന്നിട്ടും അത് തെറ്റായിരുന്നു.

പ്രൊഡക്ഷന് മുമ്പ് ഒരു AI ഏജന്റ് പ്ലേഗ്രൗണ്ട് നിർമ്മിക്കുന്നത്