ఈమెయిల్ ఏజెంట్ల కోసం హ్యూమన్-ఇన్-ది-లూప్ డిజైన్
ఒక రీఫండ్ అభ్యర్థన మీ సపోర్ట్ క్యూలోకి వస్తుంది. మీ AI ఏజెంట్ 91% నమ్మకంతో (confidence) నాలెడ్జ్ బేస్లో సమాచారాన్ని కనుగొంటుంది. అయినప్పటికీ, ఆ ఏజెంట్ ఆ సమాధానాన్ని పంపకూడదు.
చాలా బృందాలు మానవ పర్యవేక్షణను (human oversight) ఒక సాధారణ ఎంపికగా చూస్తాయి: అయితే AI మాత్రమే ఈమెయిల్స్ పంపుతుంది లేదా మనిషి ప్రతిదీ తనిఖీ చేస్తారు. ఈ రెండు పద్ధతులు విఫలమవుతాయి.
పూర్తి ఆటోమేషన్ వల్ల తప్పుడు సమాధానాలు వెళ్లి మీ బ్రాండ్కు నష్టం జరుగుతుంది. పూర్తి మానవ సమీక్ష వల్ల AI కేవలం సమయాన్ని ఆదా చేయని ఒక ఖరీదైన డ్రాఫ్ట్ జనరేటర్గా మారుతుంది.
స్విచ్కు బదులుగా ఒక డయల్ను ఉపయోగించండి. సందేశం రకాన్ని బట్టి ఆటోమేషన్ స్థాయిని నిర్ణయించండి.
గేట్ 1: నాలెడ్జ్ మ్యాచ్ (Knowledge Match) ఈ గేట్ సమాధానం పట్ల AI ఎంత నమ్మకంగా ఉందో చూస్తుంది.
• నమ్మకం (Confidence) 85% లేదా అంతకంటే ఎక్కువ: ఆర్టికల్ నుండి నేరుగా సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • నమ్మకం 60% నుండి 85%: సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ మనిషి త్వరగా ధృవీకరించడానికి మూల లింక్ (source link) కూడా చేర్చండి. • నమ్మకం 60% కంటే తక్కువ: డ్రాఫ్ట్ చేయవద్దు. మాన్యువల్ రివ్యూ కోసం ఫ్లాగ్ చేయండి.
గేట్ 2: రిస్క్ లెవల్ (Risk Level) ఈ గేట్ తప్పు జరిగితే కలిగే పరిణామాలను చూస్తుంది. ఇది కాన్ఫిడెన్స్ స్కోర్లను పరిగణనలోకి తీసుకోదు.
• తక్కువ రిస్క్ (పాస్వర్డ్ రీసెట్లు, FAQs): మానవ ఆమోదం కోసం సమాధానాన్ని డ్రాఫ్ట్ చేయండి. • మధ్యస్థ రిస్క్ (రీఫండ్లు, బిల్లింగ్ మార్పులు): సమాధానాన్ని డ్రాఫ్ట్ చేయండి, కానీ అదనపు మానవ పరిశీలన అవసరం. • అధిక రిస్క్ (లీగల్ బెదిరింపులు, మోసాలు): డ్రాఫ్ట్ చేయవద్దు. వెంటనే ఒక వ్యక్తికి పంపండి (Escalate).
అందుకే 91% కాన్ఫిడెన్స్ ఉన్న రీఫండ్ రిప్లై వెళ్లదు. కాన్ఫిడెన్స్ అనేది AIకి సమాధానం తెలుసా లేదా అని చెబుతుంది. రిస్క్ అనేది AI తప్పు చేస్తే ఏమవుతుందో చెబుతుంది. మీరు ఈ రెండు అంశాలను వేరు చేయాలి.
నియమం సరళమైనది: పంపే ముందు ఎల్లప్పుడూ డ్రాఫ్ట్ను చూపండి. ఎప్పుడూ ఆటో-సెండ్ చేయవద్దు.
మానవ పర్యవేక్షణ అనేది ఒక పన్ను (tax) కాదు. భవిష్యత్తులో మరింత ఆటోమేషన్ చేయడానికి అవసరమైన డేటాను సేకరించే మార్గం ఇది. 'డ్రాఫ్ట్-అండ్-అప్రూవ్' నుండి 'ఫుల్-ఆటో'కు మారడానికి, మీ ఖచ్చితత్వాన్ని నిరూపించడానికి లాగ్స్ (logs) ఉపయోగించండి. కేవలం ఊహలపై ఆధారపడకండి.
ఈ వారం మీ సందేశ రకాలను ఈ మూడు రిస్క్ స్థాయిలుగా విభజించండి. మీరు ఎక్కడ అతిగా సమీక్షిస్తున్నారో మరియు ఎక్కడ ఎక్కువ రిస్క్ తీసుకుంటున్నారో నిర్ణయించుకోండి.
మూలం: https://dev.to/qasim157/human-in-the-loop-design-for-email-agents-3fhc
ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi