നിങ്ങളുടെ AI-യോട് ശ്രദ്ധിക്കണമെന്ന് പറയുന്നത് നിർത്തുക

നിങ്ങളുടെ AI-യോട് ശ്രദ്ധിക്കണമെന്ന് പറയുന്നത് നിർത്തുക. അതിന് ഇന്നലത്തെ കാര്യങ്ങളെക്കുറിച്ച് ഓർമ്മയില്ല.

എന്റെ AI ഏജന്റ് തെറ്റുകൾ വരുത്തുന്നത് തടയാനായി ഞാൻ ഒരിക്കൽ വലിയൊരു നിയമങ്ങളുടെ ഫയൽ നിർമ്മിച്ചിരുന്നു. അത് പരാജയപ്പെടുമ്പോഴെല്ലാം ഞാൻ പുതിയ നിർദ്ദേശങ്ങൾ കൂട്ടിച്ചേർത്തു കൊണ്ടിരുന്നു. ആ ഫയൽ 56,000 ക്യാരക്ടറുകളായി വളർന്നു. പിന്നീട് ആ ഏജന്റ് പ്രവർത്തിക്കുന്നത് നിലച്ചു.

അതിന്റെ ശ്രദ്ധ ഞാൻ അമിതമായി വിഭജിച്ചു കളഞ്ഞു. ഞാൻ ആ നിയമങ്ങൾ 1,200 ക്യാരക്ടറുകളിലേക്ക് കുറച്ചു. കുറഞ്ഞ നിയമങ്ങളോടെ ഏജന്റ് കൂടുതൽ നന്നായി പ്രവർത്തിച്ചു.

ഞാൻ ഒരു കഠിനമായ പാഠം പഠിച്ചു. നിയമങ്ങൾ കൂട്ടിച്ചേർക്കുക എന്നതല്ല വിശ്വസനീയമായ AI നിർമ്മിക്കാനുള്ള വഴി.

മിക്ക ആളുകളും AI-യെ ഒരു മനുഷ്യ സഹപ്രവർത്തകനെപ്പോലെയാണ് കാണുന്നത്. ഇന്ന് നൽകുന്ന ഒരു തിരുത്തൽ നാളെ AI-യെ സഹായിക്കുമെന്ന് അവർ കരുതുന്നു. എന്നാൽ AI stateless ആണ്. ഓരോ സെഷനും പുതിയതായിട്ടാണ് തുടങ്ങുന്നത്. നിങ്ങളുടെ മുൻപത്തെ ഉപദേശങ്ങൾ അത് ഓർമ്മിച്ചുവെക്കില്ല.

ഒരു നിയമം അറിയുന്നതും ഒരു നിയമം പാലിക്കുന്നതും തമ്മിൽ വലിയ വ്യത്യാസമുണ്ട്.

ഒരു പ്രോംപ്റ്റിൽ നിയമം നൽകുന്നത് ഒരു നിർദ്ദേശം മാത്രമാണ്. മോഡൽ അത് കാണുന്നുണ്ടെങ്കിലും, ഒരു ടാസ്ക് പൂർത്തിയാക്കാൻ വേണ്ടി അത് അവഗണിച്ചേക്കാം. ഒരു ഏജന്റിനെ നിർത്തണമെന്നുണ്ടെങ്കിൽ, കൂടുതൽ മികച്ച ഒരു വാചകം എഴുതിയാൽ പോരാ. നിങ്ങളുടെ കോഡിൽ ഒരു ഫിസിക്കൽ ഗേറ്റ് (physical gate) നിർമ്മിക്കുക. ഒരു ചെക്ക് പാസ്സായില്ലെങ്കിൽ മുന്നോട്ട് പോകാൻ അനുവദിക്കാത്ത ഒരു സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുക.

AI എങ്ങനെ കൂടുതൽ കൃത്യമാക്കാം എന്ന് ചോദിക്കുന്നത് നിർത്തുക. തെറ്റുകൾ വരുത്തിയാൽ അതിന്റെ ആഘാതം എങ്ങനെ കുറയ്ക്കാം എന്ന് ചിന്തിച്ചു തുടങ്ങുക.

വിവരങ്ങൾ സൂചിപ്പിക്കുന്നത് കൃത്യത മാത്രം മതിയാകില്ല എന്നാണ്: • വെറും 4% കമ്പനികൾ മാത്രമാണ് ജനറേറ്റീവ് AI പ്രതീക്ഷകൾ exceed ചെയ്യുന്നു എന്ന് പറയുന്നത് (JUAS). • വെറും 5% എന്റർപ്രൈസ് AI പൈലറ്റുകൾ മാത്രമാണ് പ്രൊഡക്ഷനിൽ എത്തുന്നത് (MIT). • മിക്ക AI ഉപയോക്താക്കളും യഥാർത്ഥത്തിൽ കൂടുതൽ ഓവർടൈം ജോലി ചെയ്യുന്നു, കുറയ്ക്കുകയല്ല (Persol).

വിജയികൾക്ക് കൂടുതൽ കൃത്യതയുള്ള മോഡലുകളല്ല ഉള്ളത്. അവർക്ക് മികച്ച ഘടനകളാണ് (structures) ഉള്ളത്.

കൂടുതൽ നിയമങ്ങൾ എഴുതുന്നതിന് പകരം ഈ മൂന്ന് രീതികൾ ഉപയോഗിക്കുക:

  • അഭിപ്രായവ്യത്യാസങ്ങളെ ഒരു സിഗ്നലായി ഉപയോഗിക്കുക. ഒരേ ടാസ്ക് മൂന്ന് വ്യത്യസ്ത മോഡലുകൾ വഴി പ്രവർത്തിപ്പിക്കുക. അവ തമ്മിൽ അഭിപ്രായവ്യത്യാസമുണ്ടെങ്കിൽ, അത് ഒരു മനുഷ്യന് കൈമാറുക. അവ യോജിക്കുന്നുണ്ടെങ്കിൽ മാത്രം മുന്നോട്ട് കൊണ്ടുപോവുക.
  • എസ്‌കലേഷൻ മാനദണ്ഡങ്ങൾ (escalation criteria) എഴുതുക. ഏജന്റിന് വ്യക്തമായ എക്സിറ്റ് പോയിന്റുകൾ നൽകുക. രണ്ട് മിനിറ്റിനുള്ളിൽ ഒരു പ്രശ്നം പരിഹരിക്കാൻ കഴിഞ്ഞില്ലെങ്കിൽ, അത് നിർത്താനും ഒരു മനുഷ്യനോട് ചോദിക്കാനും നിർദ്ദേശിക്കുക.
  • ഏജന്റിന് ഒരു നിശ്ചിത ചുമതല നൽകുക. സഹായിക്കാൻ എന്ന രീതിയിലുള്ള അവ്യക്തമായ നിർദ്ദേശങ്ങൾ നൽകരുത്. മീറ്റിംഗ് മിനിറ്റ്സ് തയ്യാറാക്കുന്നത് പോലെ ഒരു പ്രത്യേക ജോലി മാത്രം നൽകുക. ഒരു പരിമിതമായ ജോലി നൽകുന്നത് വഴി, തെറ്റുകൾ സംഭവിച്ചാൽ അതിന്റെ ആഘാതം കുറവായിരിക്കും.

യഥാർത്ഥ ഗാർഡ്‌റെയിലുകൾ (guardrails) നിങ്ങളെ സാവധാനത്തിലാക്കാനല്ല നിർമ്മിച്ചിരിക്കുന്നത്. ഏജന്റ് എവിടെ വെച്ച് നിർത്തണമെന്ന് നിങ്ങൾക്ക് കൃത്യമായി അറിയാവുന്നത് കൊണ്ട്, കൂടുതൽ വേഗത്തിൽ മുന്നോട്ട് പോകാൻ അവ നിങ്ങളെ സഹായിക്കുന്നു.

നിങ്ങളുടെ AI-ക്ക് ഉപദേശങ്ങൾ നൽകുന്നത് നിർത്തുക. AI തെറ്റുകൾ വരുത്തിയാലും പ്രവർത്തിക്കുന്ന ഒരു ഘടന നിർമ്മിക്കുക.

Source: https://dev.to/nomurasan/stop-telling-your-ai-to-be-careful-next-time-it-has-no-memory-of-yesterday-i6c

Optional learning community: https://t.me/GyaanSetuAi