𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

📅3 hours ago⏱2 min read

ఈమెయిల్ ఏజెంట్ల కోసం హ్యూమన్-ఇన్-ది-లూప్ డిజైన్

ఒక రీఫండ్ అభ్యర్థన మీ సపోర్ట్ క్యూలోకి వస్తుంది. మీ AI ఏజెంట్ 91% నమ్మకంతో (confidence) నాలెడ్జ్ బేస్‌లో సమాచారాన్ని కనుగొంటుంది. అయినప్పటికీ, ఆ ఏజెంట్ ఆ సమాధానాన్ని పంపకూడదు.

చాలా బృందాలు మానవ పర్యవేక్షణను (human oversight) ఒక సాధారణ ఎంపికగా చూస్తాయి: అయితే AI మాత్రమే ఈమెయిల్స్ పంపుతుంది లేదా మనిషి ప్రతిదీ తనిఖీ చేస్తారు. ఈ రెండు పద్ధతులు విఫలమవుతాయి.

పూర్తి ఆటోమేషన్ వల్ల తప్పుడు సమాధానాలు వెళ్లి మీ బ్రాండ్‌కు నష్టం జరుగుతుంది. పూర్తి మానవ సమీక్ష వల్ల AI కేవలం సమయాన్ని ఆదా చేయని ఒక ఖరీదైన డ్రాఫ్ట్ జనరేటర్‌గా మారుతుంది.

స్విచ్‌కు బదులుగా ఒక డయల్‌ను ఉపయోగించండి. సందేశం రకాన్ని బట్టి ఆటోమేషన్ స్థాయిని నిర్ణయించండి.

గేట్ 1: నాలెడ్జ్ మ్యాచ్ (Knowledge Match) ఈ గేట్ సమాధానం పట్ల AI ఎంత నమ్మకంగా ఉందో చూస్తుంది.

• నమ్మకం (Confidence) 85% లేదా అంతకంటే ఎక్కువ: ఆర్టికల్ నుండి నేరుగా సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • నమ్మకం 60% నుండి 85%: సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ మనిషి త్వరగా ధృవీకరించడానికి మూల లింక్ (source link) కూడా చేర్చండి. • నమ్మకం 60% కంటే తక్కువ: డ్రాఫ్ట్ చేయవద్దు. మాన్యువల్ రివ్యూ కోసం ఫ్లాగ్ చేయండి.

గేట్ 2: రిస్క్ లెవల్ (Risk Level) ఈ గేట్ తప్పు జరిగితే కలిగే పరిణామాలను చూస్తుంది. ఇది కాన్ఫిడెన్స్ స్కోర్‌లను పరిగణనలోకి తీసుకోదు.

• తక్కువ రిస్క్ (పాస్‌వర్డ్ రీసెట్లు, FAQs): మానవ ఆమోదం కోసం సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • మధ్యస్థ రిస్క్ (రీఫండ్‌లు, బిల్లింగ్ మార్పులు): సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ అదనపు మానవ పరిశీలన అవసరం. • అధిక రిస్క్ (లీగల్ బెదిరింపులు, మోసాలు): డ్రాఫ్ట్ చేయవద్దు. వెంటనే ఒక వ్యక్తికి పంపండి (Escalate).

అందుకే 91% కాన్ఫిడెన్స్ ఉన్న రీఫండ్ రిప్లై వెళ్లదు. కాన్ఫిడెన్స్ అనేది AIకి సమాధానం తెలుసా లేదా అని చెబుతుంది. రిస్క్ అనేది AI తప్పు చేస్తే ఏమవుతుందో చెబుతుంది. మీరు ఈ రెండు అంశాలను వేరు చేయాలి.

నియమం సరళమైనది: పంపే ముందు ఎల్లప్పుడూ డ్రాఫ్ట్‌ను చూపండి. ఎప్పుడూ ఆటో-సెండ్ చేయవద్దు.

మానవ పర్యవేక్షణ అనేది ఒక పన్ను (tax) కాదు. భవిష్యత్తులో మరింత ఆటోమేషన్ చేయడానికి అవసరమైన డేటాను సేకరించే మార్గం ఇది. 'డ్రాఫ్ట్-అండ్-అప్రూవ్' నుండి 'ఫుల్-ఆటో'కు మారడానికి, మీ ఖచ్చితత్వాన్ని నిరూపించడానికి లాగ్స్ (logs) ఉపయోగించండి. కేవలం ఊహలపై ఆధారపడకండి.

ఈ వారం మీ సందేశ రకాలను ఈ మూడు రిస్క్ స్థాయిలుగా విభజించండి. మీరు ఎక్కడ అతిగా సమీక్షిస్తున్నారో మరియు ఎక్కడ ఎక్కువ రిస్క్ తీసుకుంటున్నారో నిర్ణయించుకోండి.

మూలం: https://dev.to/qasim157/human-in-the-loop-design-for-email-agents-3fhc

ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi

𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

ఏజెంటిక్ AI గవర్నెన్స్ ఫ్రేమ్‌వర్క్

ఈమెయిల్ ఏజెంట్ల కోసం అబ్జర్వబిలిటీ