ఈమెయిల్ ఏజెంట్ల కోసం హ్యూమన్-ఇన్-ది-లూప్ డిజైన్

ఒక రీఫండ్ అభ్యర్థన మీ సపోర్ట్ క్యూలోకి వస్తుంది. మీ AI ఏజెంట్ 91% నమ్మకంతో (confidence) నాలెడ్జ్ బేస్‌లో సమాచారాన్ని కనుగొంటుంది. అయినప్పటికీ, ఆ ఏజెంట్ ఆ సమాధానాన్ని పంపకూడదు.

చాలా బృందాలు మానవ పర్యవేక్షణను (human oversight) ఒక సాధారణ ఎంపికగా చూస్తాయి: అయితే AI మాత్రమే ఈమెయిల్స్ పంపుతుంది లేదా మనిషి ప్రతిదీ తనిఖీ చేస్తారు. ఈ రెండు పద్ధతులు విఫలమవుతాయి.

పూర్తి ఆటోమేషన్ వల్ల తప్పుడు సమాధానాలు వెళ్లి మీ బ్రాండ్‌కు నష్టం జరుగుతుంది. పూర్తి మానవ సమీక్ష వల్ల AI కేవలం సమయాన్ని ఆదా చేయని ఒక ఖరీదైన డ్రాఫ్ట్ జనరేటర్‌గా మారుతుంది.

స్విచ్‌కు బదులుగా ఒక డయల్‌ను ఉపయోగించండి. సందేశం రకాన్ని బట్టి ఆటోమేషన్ స్థాయిని నిర్ణయించండి.

గేట్ 1: నాలెడ్జ్ మ్యాచ్ (Knowledge Match) ఈ గేట్ సమాధానం పట్ల AI ఎంత నమ్మకంగా ఉందో చూస్తుంది.

• నమ్మకం (Confidence) 85% లేదా అంతకంటే ఎక్కువ: ఆర్టికల్ నుండి నేరుగా సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • నమ్మకం 60% నుండి 85%: సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ మనిషి త్వరగా ధృవీకరించడానికి మూల లింక్ (source link) కూడా చేర్చండి. • నమ్మకం 60% కంటే తక్కువ: డ్రాఫ్ట్ చేయవద్దు. మాన్యువల్ రివ్యూ కోసం ఫ్లాగ్ చేయండి.

గేట్ 2: రిస్క్ లెవల్ (Risk Level) ఈ గేట్ తప్పు జరిగితే కలిగే పరిణామాలను చూస్తుంది. ఇది కాన్ఫిడెన్స్ స్కోర్‌లను పరిగణనలోకి తీసుకోదు.

• తక్కువ రిస్క్ (పాస్‌వర్డ్ రీసెట్లు, FAQs): మానవ ఆమోదం కోసం సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • మధ్యస్థ రిస్క్ (రీఫండ్‌లు, బిల్లింగ్ మార్పులు): సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ అదనపు మానవ పరిశీలన అవసరం. • అధిక రిస్క్ (లీగల్ బెదిరింపులు, మోసాలు): డ్రాఫ్ట్ చేయవద్దు. వెంటనే ఒక వ్యక్తికి పంపండి (Escalate).

అందుకే 91% కాన్ఫిడెన్స్ ఉన్న రీఫండ్ రిప్లై వెళ్లదు. కాన్ఫిడెన్స్ అనేది AIకి సమాధానం తెలుసా లేదా అని చెబుతుంది. రిస్క్ అనేది AI తప్పు చేస్తే ఏమవుతుందో చెబుతుంది. మీరు ఈ రెండు అంశాలను వేరు చేయాలి.

నియమం సరళమైనది: పంపే ముందు ఎల్లప్పుడూ డ్రాఫ్ట్‌ను చూపండి. ఎప్పుడూ ఆటో-సెండ్ చేయవద్దు.

మానవ పర్యవేక్షణ అనేది ఒక పన్ను (tax) కాదు. భవిష్యత్తులో మరింత ఆటోమేషన్ చేయడానికి అవసరమైన డేటాను సేకరించే మార్గం ఇది. 'డ్రాఫ్ట్-అండ్-అప్రూవ్' నుండి 'ఫుల్-ఆటో'కు మారడానికి, మీ ఖచ్చితత్వాన్ని నిరూపించడానికి లాగ్స్ (logs) ఉపయోగించండి. కేవలం ఊహలపై ఆధారపడకండి.

ఈ వారం మీ సందేశ రకాలను ఈ మూడు రిస్క్ స్థాయిలుగా విభజించండి. మీరు ఎక్కడ అతిగా సమీక్షిస్తున్నారో మరియు ఎక్కడ ఎక్కువ రిస్క్ తీసుకుంటున్నారో నిర్ణయించుకోండి.

మూలం: https://dev.to/qasim157/human-in-the-loop-design-for-email-agents-3fhc

ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi