ఒక AI ఏజెంట్లోని అత్యంత కష్టమైన భాగం 'అన్హ్యాపీ పాత్' (Unhappy Path)
చాలా AI ఏజెంట్ డెమోలు ఒక పరిపూర్ణమైన పరిస్థితిని చూపిస్తాయి. ఒక స్పష్టమైన ప్రశ్న ఒక చక్కని సమాధానానికి దారితీస్తుంది. అందరూ చప్పట్లు కొడతారు.
వస్తువులు లేదా వ్యవస్థలు విఫలమైనప్పుడే అసలైన ఇంజనీరింగ్ జరుగుతుంది.
ఒక API పనిచేయకపోతే ఏమవుతుంది? ఒక ఏజెంట్ అనంతంగా లూప్లో ఉండి మీ క్రెడిట్ కార్డ్ బ్యాలెన్స్ను ఖర్చు చేస్తే ఏమవుతుంది? ఏజెంట్ వద్ద డేటా లేకపోయినా, అది నిజమైనదిగా కనిపించే రిపోర్టును రాస్తే ఏమవుతుంది?
జెనోమిక్స్లో (genomics) ఈ సమస్యలను పరిష్కరించడానికి నేను BioAgentను రూపొందించాను. ఇది డేటాను సేకరించి, PubMedలో వెతికి, క్లినికల్ రిపోర్టులను రాసే ఒక స్వయంప్రతిపత్తి కలిగిన అనలిస్ట్ (autonomous analyst).
దీనిని నిర్మించడానికి నేను LangGraph మరియు Claudeలను ఉపయోగించాను. వైఫల్యాలను ఎదుర్కోవడానికి సిద్ధంగా ఉండటం గురించి నేను నేర్చుకున్న విషయాలు ఇక్కడ ఉన్నాయి.
ప్రతి లూప్కు పరిమితి విధించండి (Bound every loop) ఏజెంట్కు ఖచ్చితమైన రీట్రై లిమిట్ (retry limit) ఉండాలి. మీ ఏజెంట్ పెయిడ్ APIలను ఉపయోగిస్తుంటే, లూప్ అనేది ఆర్థికపరమైన రిస్క్. ప్రతి దశలోనూ కౌంటర్ను పెంచితేనే ఆ లిమిట్ పనిచేస్తుంది. మీరు ఆ ఒక్క లైన్ కోడ్ను మర్చిపోతే, సిస్టమ్ క్రాష్ అయ్యే వరకు ఏజెంట్ లూప్లో తిరుగుతూనే ఉంటుంది.
విజయాన్ని కాదు, వైఫల్యాన్ని పరీక్షించండి (Test the failure, not the success) డెవలప్మెంట్ సమయంలో 'హ్యాపీ పాత్' (happy path) ఎప్పుడూ సరిగ్గా పనిచేస్తుంది. టెస్టింగ్ సమయంలో మీ డిపెండెన్సీలు (dependencies) విఫలమయ్యేలా మీరు చేయాలి. ఒక API ఆఫ్లైన్లో ఉన్నప్పుడు, ఏజెంట్ లూప్లో పడకుండా, క్రమంగా తన పనితీరును తగ్గించుకుంటూ (degrades gracefully) సాఫీగా పనిచేసేలా పరీక్షలు రాయండి.
నమ్మకంతో కూడిన అర్థం లేని సమాచారాన్ని నివారించండి (Prevent confident nonsense) అతిపెద్ద ప్రమాదం సిస్టమ్ క్రాష్ అవ్వడం కాదు. ప్రొఫెషనల్గా కనిపిస్తూనే, తప్పుడు డేటాతో కూడిన రిపోర్టును ఇవ్వడమే అసలైన ప్రమాదం. హాలూసినేషన్స్ (hallucinations) ఆపడానికి కేవలం ప్రాంప్ట్ సూచనలపై మాత్రమే ఆధారపడకండి. ఏజెంట్ ఎప్పుడూ తప్పుడు మెట్రిక్స్ను సృష్టించకుండా ఉండటానికి పరీక్షలను ఉపయోగించండి.
మీ ఫలితాలను వాస్తవాలతో అనుసంధానించండి (Ground your results) టెక్స్ట్ రైటర్కు చేరినప్పుడే రిట్రీవల్ (retrieval) ఉపయోగకరంగా ఉంటుంది. పూర్తి అబ్స్ట్రాక్ట్లకు బదులుగా కేవలం IDలను మాత్రమే పంపడం వల్ల, మోడల్ తనకు నచ్చినట్లుగా సంబంధం లేని విషయాలను సృష్టించడం నేను గమనించాను. రిపోర్టు వాస్తవాలపై ఆధారపడి ఉండేలా చూడటానికి, మీరు మోడల్కు అసలైన టెక్స్ట్ను పంపాలి.
ప్రాంప్ట్లో ఉండే నియమం ఒక ఆశ మాత్రమే. టెస్ట్లో ఉండే నియమం ఒక గ్యారెంటీ.
'అన్హ్యాపీ పాత్' కోసం సిద్ధంగా ఉండండి. నిజానికి ప్రాముఖ్యత కలిగినది అదే.
Source: https://dev.to/gbadedata/the-hardest-part-of-an-autonomous-ai-agent-is-the-unhappy-path-3p2c
Optional learning community: https://t.me/GyaanSetuAi
