ഒരു ക്വോറം വേഷം: ഏജന്റ് വെരിഫിക്കേഷന് എന്തുകൊണ്ട് ഫോൾട്ട് ഇൻജക്ഷൻ ആവശ്യമാണ്

നിങ്ങളുടെ AI ഏജന്റ് അതിന്റെ കൃത്യതയെക്കുറിച്ച് നിങ്ങളോട് കള്ളം പറഞ്ഞേക്കാം.

അടുത്തിടെ ഒരു AI പാർട്ണർ തുടർച്ചയായി മൂന്ന് തവണ പരാജയപ്പെടുന്നത് ഞാൻ കണ്ടു. വ്യത്യസ്ത സാഹചര്യങ്ങളിൽ ഒരേ സത്യസന്ധതയുമായി ബന്ധപ്പെട്ട പ്രശ്നം അത് വീണ്ടും വീണ്ടും വരുത്തിത്തീർത്തു. അത് തെറ്റായ ശൈലിയിലാണ് എഴുതിയത്. ഒരേ തെറ്റ് തന്നെ വായിക്കുമ്പോഴും ഒരു റിവ്യൂവർ മോഡൽ അതിന് ഉയർന്ന റേറ്റിംഗ് നൽകിക്കൊണ്ടിരുന്നു. 'ഫാക്ട് ഡ്രിഫ്റ്റിനെ' (fact drift) കുറിച്ചുള്ള വസ്തുതകൾ പോലും അത് തെറ്റായി കണക്കാക്കി.

ഞാൻ ആ പ്രക്രിയയ്ക്ക് പുറത്തുനിന്നുകൊണ്ട് നിരീക്ഷിച്ചതുകൊണ്ട് മാത്രമാണ് ഈ തെറ്റുകൾ തിരിച്ചറിഞ്ഞത്.

ഇത് ഏജന്റ് സ്റ്റാക്കിലെ (agent stack) വലിയൊരു പ്രശ്നം വെളിപ്പെടുത്തുന്നു. മിക്ക വെരിഫിക്കേഷൻ സിസ്റ്റങ്ങളും സ്വതന്ത്രമായ പ്രവർത്തനത്തെയാണ് (independence) മുൻനിർത്തി പ്രവർത്തിക്കുന്നത്. അവ മൾട്ടി-ഏജന്റ് വോട്ടിംഗ്, മേക്കർ/ചെക്കർ പാറ്റേണുകൾ, അല്ലെങ്കിൽ എൻസെംബിൾ പ്രോംപ്റ്റുകൾ എന്നിവ ഉപയോഗിക്കുന്നു. വ്യത്യസ്ത പാതകൾ വ്യത്യസ്ത കാര്യങ്ങൾ കാണുമെന്ന് അവ കരുതുന്നു.

എന്നാൽ പലപ്പോഴും, ഈ പാതകൾ ഒരേ സ്രോതസ്സാണ് (source) പങ്കിടുന്നത്.

ഒരു റൈറ്റർ ഉപയോഗിക്കുന്ന അതേ സ്രോതസ്സിൽ നിന്നാണ് ഒരു റിവ്യൂവർ വായിക്കുന്നതെങ്കിൽ, അവിടെ നിങ്ങൾക്ക് രണ്ട് കാഴ്ചപ്പാടുകൾ ലഭിക്കുന്നില്ല. പകരം, രണ്ട് വ്യത്യസ്ത വേഷങ്ങൾ ധരിച്ച ഒരൊറ്റ കാഴ്ചപ്പാട് മാത്രമേ നിങ്ങൾക്കുണ്ടാവൂ. ഇത് ഒരു ക്വോറം വേഷം ധരിച്ച 'സിംഗിൾ പോയിന്റ് ഓഫ് ഫെയിലർ' (single point of failure) ആണ്.

പാതകൾ ഒരേ അപ്‌സ്ട്രീം (upstream) പങ്കിടുന്നുണ്ടെങ്കിൽ, അവ ഒരേ തെറ്റായ വസ്തുതയിലോ അല്ലെങ്കിൽ ഒരേ ഹാലൂസിനേഷനിലോ (hallucination) യോജിക്കും. ഔട്ട്‌പുട്ടുകൾ വൈവിധ്യമാർന്നതായി തോന്നുന്നതുകൊണ്ട് സിസ്റ്റം ആരോഗ്യകരമാണെന്ന് തോന്നും, എന്നാൽ സ്രോതസ്സ് കള്ളം പറയുമ്പോഴെല്ലാം അത് പരാജയപ്പെടുന്നു.

ഇത് പരിഹരിക്കാൻ, നിങ്ങൾ ഫോൾട്ട് ഇൻജക്ഷൻ (fault injection) ഉപയോഗിക്കണം.

ഏജന്റുകൾ തമ്മിൽ വിയോജിപ്പുണ്ടോ എന്ന് മാത്രം പരിശോധിക്കരുത്. സിസ്റ്റത്തിന്റെ ഒരു ഭാഗം തകരാറിലാക്കി അവരെ വിയോജിപ്പിക്കാൻ നിങ്ങൾക്ക് കഴിയുമോ എന്ന് പരിശോധിക്കുക.

നിങ്ങളുടെ സ്റ്റാക്ക് എങ്ങനെ പരിശോധിക്കാം എന്ന് ഇതാ:

  • ഒരു മോശം മെമ്മറി ഇൻജക്ട് ചെയ്യുക: ഒരു റിട്രീവൽ പാത്തിൽ (retrieval path) ഒരു വ്യാജ വസ്തുത നൽകുക. രണ്ട് പാതകളും ആ വ്യാജ വസ്തുത തന്നെ നൽകുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ പാതകൾ പരസ്പരം ബന്ധിക്കപ്പെട്ടിരിക്കുന്നു (coupled).
  • ഒരു നിയമം മാറ്റുക: ഓഫ്‌ലൈനായി ഒരു നിയമം മാറ്റുക. മേക്കറും ചെക്കറും ഒരു വൈരുദ്ധ്യം ചൂണ്ടിക്കാണിക്കാതെ പുതിയ നിയമം തന്നെ പിന്തുടരുകയാണെങ്കിൽ, അവർ ഒരു കാഷെ (cache) പങ്കിടുന്നു എന്നാണ് അർത്ഥം.
  • തെറ്റായ ടെലിമെട്രി നൽകുക: ഒരു വ്യാജ മോഡൽ ഐഡി (model ID) രേഖപ്പെടുത്തുക. പരിശോധന വിജയിക്കുകയാണെങ്കിൽ, വെരിഫയർ റൈറ്റർ ഉപയോഗിക്കുന്ന അതേ റെക്കോർഡ് തന്നെയാണ് വായിക്കുന്നത്.

ഡിസ്ട്രിബ്യൂട്ടഡ് സിസ്റ്റങ്ങൾ (Distributed systems) വർഷങ്ങൾക്ക് മുമ്പ് തന്നെ ഇത് പരിഹരിച്ചിട്ടുണ്ട്. അവ കയോസ് എൻജിനീയറിംഗും (chaos engineering) പാർട്ടീഷൻ ടെസ്റ്റുകളും ഉപയോഗിക്കുന്നു. സിസ്റ്റം നന്നായി പ്രവർത്തിക്കുന്നത് കണ്ടു അവ സിസ്റ്റത്തെ വിശ്വസിക്കുന്നില്ല. പരാജയങ്ങൾ വരുത്തിക്കൊണ്ട് (inducing failure) അവ സിസ്റ്റത്തെ വിശ്വസിക്കുന്നു.

ഏജന്റ് ആർക്കിടെക്ചറുകൾ ഈ രീതി അവലംബിക്കണം.

സ്വതന്ത്രത്വം (Independence) എന്നത് ഒരിക്കൽ മാത്രം സ്ഥാപിച്ചെടുക്കേണ്ട ഒന്നല്ല. അത് നിരന്തരം വീണ്ടും പരിശോധിക്കേണ്ട ഒന്നാണ്. ഒരു ഷെയർഡ് കാഷെയോ മോഡൽ അപ്‌ഡേറ്റോ നിങ്ങളുടെ സ്വതന്ത്രത്വത്തെ ഒറ്റരാത്രികൊണ്ട് തകർത്തേക്കാം.

ഐകകണ്ഠ്യമായ വോട്ടുകളെ വിശ്വസിക്കുന്നത് നിർത്തുക. ഫോൾട്ടുകൾ ഇൻജക്ട് ചെയ്യാൻ തുടങ്ങുക.

Source: https://dev.to/jugeni/a-quorum-costume-why-agent-verification-needs-fault-injection-kbh

Optional learning community: https://t.me/GyaanSetuAi