𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

📅3 hours ago⏱2 min read

ഇമെയിൽ ഏജന്റുകൾക്കായുള്ള ഹ്യൂമൻ-ഇൻ-ദി-ലൂപ്പ് ഡിസൈൻ (Human-in-the-loop Design for Email Agents)

ഒരു റീഫണ്ട് അഭ്യർത്ഥന നിങ്ങളുടെ സപ്പോർട്ട് ക്യൂവിൽ എത്തുന്നു. നിങ്ങളുടെ AI ഏജന്റ് 91% കോൺഫിഡൻസോടെ (confidence) ഒരു നോളജ് ബേസ് മാച്ച് കണ്ടെത്തുന്നു. എങ്കിലും ഏജന്റ് ആ മറുപടി അയക്കരുത്.

മിക്ക ടീമുകളും ഹ്യൂമൻ ഓവർസൈറ്റിനെ (human oversight) ഒരു ലളിതമായ തിരഞ്ഞെടുപ്പായി കാണുന്നു: ഒന്നുകിൽ AI തനിയെ ഇമെയിലുകൾ അയക്കുന്നു, അല്ലെങ്കിൽ ഒരു മനുഷ്യൻ എല്ലാം പരിശോധിക്കുന്നു. രണ്ട് രീതികളും പരാജയപ്പെടുന്നു.

പൂർണ്ണമായ ഓട്ടോമേഷൻ നിങ്ങളുടെ ബ്രാൻഡിനെ ദോഷകരമായി ബാധിക്കുന്ന മോശം മറുപടികളിലേക്ക് നയിക്കുന്നു. പൂർണ്ണമായ മനുഷ്യ പരിശോധന AI-യെ സമയം ലാഭിക്കാത്ത, ചെലവേറിയ ഒരു ഡ്രാഫ്റ്റ് ജനറേറ്റർ മാത്രമാക്കുന്നു.

ഒരു സ്വിച്ചിന് പകരം ഒരു ഡയൽ (dial) ഉപയോഗിക്കുക. സന്ദേശത്തിന്റെ തരം അനുസരിച്ച് ഓട്ടോമേഷൻ നില നിശ്ചയിക്കുക.

ഗേറ്റ് 1: നോളജ് മാച്ച് (Knowledge Match) AI ഉത്തരത്തിൽ എത്രത്തോളം ഉറപ്പുള്ളതാണെന്ന് ഈ ഗേറ്റ് പരിശോധിക്കുന്നു.

• കോൺഫിഡൻസ് 85% അല്ലെങ്കിൽ അതിൽ കൂടുതൽ: ആർട്ടിക്കിളിൽ നിന്ന് നേരിട്ട് മറുപടി തയ്യാറാക്കുക (Draft). • കോൺഫിഡൻസ് 60% മുതൽ 85% വരെ: മറുപടി തയ്യാറാക്കുക, എന്നാൽ ഒരു മനുഷ്യന് വേഗത്തിൽ പരിശോധിക്കാൻ കഴിയുന്ന രീതിയിൽ സോഴ്സ് ലിങ്ക് ഉൾപ്പെടുത്തുക. • കോൺഫിഡൻസ് 60%-ൽ താഴെ: ഡ്രാഫ്റ്റ് തയ്യാറാക്കരുത്. മാനുവൽ റിവ്യൂവിനായി ഫ്ലാഗ് ചെയ്യുക.

ഗേറ്റ് 2: റിസ്ക് ലെവൽ (Risk Level) ഒരു തെറ്റ് സംഭവിച്ചാൽ ഉണ്ടാകുന്ന പ്രത്യാഘാതങ്ങളെക്കുറിച്ച് ഈ ഗേറ്റ് പരിശോധിക്കുന്നു. ഇത് കോൺഫിഡൻസ് സ്കോറുകളെ അവഗണിക്കുന്നു.

• കുറഞ്ഞ റിസ്ക് (പാസ്‌വേഡ് റീസെറ്റ്, FAQs): മനുഷ്യന്റെ അംഗീകാരത്തിനായി മറുപടി തയ്യാറാക്കുക. • ഇടത്തരം റിസ്ക് (റീഫണ്ടുകൾ, ബില്ലിംഗ് മാറ്റങ്ങൾ): മറുപടി തയ്യാറാക്കുക, എന്നാൽ കൂടുതൽ മനുഷ്യ പരിശോധന ആവശ്യമാണ്. • ഉയർന്ന റിസ്ക് (നിയമപരമായ ഭീഷണികൾ, തട്ടിപ്പുകൾ): ഡ്രാഫ്റ്റ് തയ്യാറാക്കരുത്. ഉടൻ തന്നെ ഒരു വ്യക്തിയെ അറിയിക്കുക (Escalate).

അതുകൊണ്ടാണ് 91% കോൺഫിഡൻസുള്ള ഒരു റീഫണ്ട് മറുപടി അയക്കാത്തത്. AI-ക്ക് ഉത്തരം അറിയാമോ എന്ന് കോൺഫിഡൻസ് പറയുന്നു. AI തെറ്റാണെങ്കിൽ എന്ത് സംഭവിക്കുമെന്ന് റിസ്ക് പറയുന്നു. ഈ രണ്ട് ആശയങ്ങളെയും നിങ്ങൾ വേർതിരിക്കണം.

നിയമം ലളിതമാണ്: അയക്കുന്നതിന് മുമ്പ് എപ്പോഴും ഡ്രാഫ്റ്റ് കാണിക്കുക. ഒരിക്കലും ഓട്ടോ-സെൻഡ് ചെയ്യരുത്.

ഹ്യൂമൻ ഓവർസൈറ്റ് എന്നത് ഒരു നികുതിയല്ല. പിന്നീട് കൂടുതൽ കാര്യങ്ങൾ ഓട്ടോമേറ്റ് ചെയ്യാൻ ആവശ്യമായ ഡാറ്റ ശേഖരിക്കാനുള്ള മാർഗമാണിത്. 'ഡ്രാഫ്റ്റ്-ആൻഡ്-അപ്രൂവ്' രീതിയിൽ നിന്ന് 'ഫുൾ-ഓട്ടോ' രീതിയിലേക്ക് മാറാൻ, നിങ്ങളുടെ കൃത്യത തെളിയിക്കാൻ ലോഗുകൾ (logs) ഉപയോഗിക്കുക. വികാരങ്ങളെ മാത്രം ആശ്രയിക്കരുത്.

ഈ ആഴ്ച നിങ്ങളുടെ സന്ദേശങ്ങളുടെ തരങ്ങളെ ഈ മൂന്ന് റിസ്ക് തലങ്ങളിൽ (risk tiers) തരംതിരിക്കുക. എവിടെയാണ് നിങ്ങൾ അമിതമായി പരിശോധിക്കുന്നതെന്നും എവിടെയാണ് നിങ്ങൾ അമിത റിസ്ക് എടുക്കുന്നതെന്നും തീരുമാനിക്കുക.

സ്രോതസ്സ്: https://dev.to/qasim157/human-in-the-loop-design-for-email-agents-3fhc

ഓപ്ഷണൽ ലേണിംഗ് കമ്മ്യൂണിറ്റി: https://t.me/GyaanSetuAi

𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸

ഇമെയിൽ ഏജന്റുകൾക്കായുള്ള ഒബ്സർവബിലിറ്റി