ఒక క్వోరం వేషధారణ: ఏజెంట్ వెరిఫికేషన్కు ఫాల్ట్ ఇంజెక్షన్ ఎందుకు అవసరం
మీ AI ఏజెంట్ తన స్వంత ఖచ్చితత్వం గురించి మీకు అబద్ధం చెబుతూ ఉండవచ్చు.
నేను ఇటీవల ఒక AI పార్ట్నర్ వరుసగా మూడుసార్లు విఫలం కావడం చూశాను. వివిధ సందర్భాలలో అది ఒకే రకమైన సత్య సమస్యను గుర్తించలేకపోయింది. అది తప్పు శైలిలో (wrong voice) రాసింది. రివ్యూయర్ మోడల్ ప్రతిసారీ అదే తప్పును చదివినప్పటికీ దానికి ఎక్కువ రేటింగ్ ఇచ్చింది. అది ఫ్యాక్ట్ డ్రిఫ్ట్ (fact drift) గురించి ఉన్న వాస్తవాలను కూడా తప్పుగా లెక్కించింది.
నేను ఆ లూప్ వెలుపల ఉండటం వల్ల మాత్రమే ఈ తప్పులను పట్టుకోగలిగాను.
ఇది ఏజెంట్ స్టాక్లో ఉన్న ఒక పెద్ద సమస్యను బయటపెడుతోంది. చాలా వెరిఫికేషన్ సిస్టమ్స్ స్వతంత్రతను (independence) ఊహిస్తాయి. అవి మల్టీ-ఏజెంట్ ఓటింగ్, మేకర్/చెకర్ ప్యాటర్న్స్ లేదా ఎంసెంబుల్ ప్రాంప్ట్లను ఉపయోగిస్తాయి. వేర్వేరు మార్గాలు వేర్వేరు విషయాలను గమనిస్తాయని అవి భావిస్తాయి.
కానీ తరచుగా, ఈ మార్గాలు ఒకే మూలాన్ని (source) పంచుకుంటాయి.
రివ్యూయర్ మరియు రైటర్ ఒకే మూలం నుండి చదివినప్పుడు, మీకు రెండు విభిన్న దృక్పథాలు ఉండవు. మీకు రెండు వేర్వేరు పాత్రల్లో ఉన్న ఒకే దృక్పథం ఉంటుంది. ఇది క్వోరం వేషధారణలో ఉన్న ఒక సింగిల్ పాయింట్ ఆఫ్ ఫెయిల్యూర్ (single point of failure).
ఒకవేళ ఆ మార్గాలు ఒకే అప్స్ట్రీమ్ (upstream) ను పంచుకుంటే, అవి ఒకే తప్పు వాస్తవం లేదా ఒకే హాలూసినేషన్ (hallucination) పై ఏకీభవిస్తాయి. అవుట్పుట్లు వైవిధ్యంగా కనిపిస్తున్నందున సిస్టమ్ ఆరోగ్యంగా ఉన్నట్లు అనిపిస్తుంది, కానీ మూలం అబద్ధం చెప్పిన ప్రతిసారీ అది విఫలమవుతుంది.
దీనిని సరిచేయడానికి, మీరు ఫాల్ట్ ఇంజెక్షన్ (fault injection) ఉపయోగించాలి.
ఏజెంట్లు విభేదిస్తున్నాయా లేదా అని మాత్రమే కొలవకండి. సిస్టమ్లోని ఒక భాగాన్ని పాడు చేయడం ద్వారా మీరు వారిని విభేదించేలా చేయగలరా లేదా అని పరీక్షించండి.
మీ స్టాక్ను ఇలా పరీక్షించవచ్చు:
- ఒక తప్పుడు మెమరీని ఇంజెక్ట్ చేయండి: ఒక రిట్రీవల్ పాత్లో (retrieval path) ఒక నకిలీ వాస్తవాన్ని ఉంచండి. రెండు మార్గాలు కూడా అదే నకిలీ వాస్తవాన్ని అందిస్తే, మీ మార్గాలు ఒకదానితో ఒకటి అనుసంధానించబడి (coupled) ఉన్నాయని అర్థం.
- ఒక రూల్ను మార్చండి: ఆఫ్లైన్లో ఒక రూల్ను మార్చండి. మేకర్ మరియు చెకర్ రెండూ ఎటువంటి తేడాను గుర్తించకుండా కొత్త రూల్ను అనుసరిస్తే, అవి ఒకే క్యాచీని (cache) పంచుకుంటున్నాయని అర్థం.
- తప్పుడు టెలిమెట్రీని ఉంచండి: ఒక నకిలీ మోడల్ IDని లాగ్ చేయండి. చెక్ పాస్ అయితే, వెరిఫైయర్ మరియు రైటర్ ఒకే రికార్డును చదువుతున్నారని అర్థం.
డిస్ట్రిబ్యూటెడ్ సిస్టమ్స్ దీనిని సంవత్సరాల క్రితమే పరిష్కరించాయి. అవి కీయస్ ఇంజనీరింగ్ (chaos engineering) మరియు పార్టిషన్ టెస్ట్లను ఉపయోగిస్తాయి. సిస్టమ్ బాగా నడుస్తుండటం చూసి అవి నమ్మవు. వైఫల్యాన్ని కలిగించడం ద్వారా (inducing failure) అవి నమ్మకాన్ని నిర్ధారిస్తాయి.
ఏజెంట్ ఆర్కిటెక్చర్లు ఈ క్రమశిక్షణను అవలంబించాలి.
స్వతంత్రత అనేది మీరు ఒకసారి ఏర్పాటు చేసుకునే లక్షణం కాదు. అది మీరు నిరంతరం పునఃధృవీకరించవలసిన లక్షణం. ఒకే క్యాచీ లేదా మోడల్ అప్డేట్ రాత్రికి రాత్రే మీ స్వతంత్రతను దెబ్బతీయవచ్చు.
ఏకగ్రీవ ఓట్లను నమ్మడం ఆపండి. ఫాల్ట్లను ఇంజెక్ట్ చేయడం ప్రారంభించండి.
Source: https://dev.to/jugeni/a-quorum-costume-why-agent-verification-needs-fault-injection-kbh
Optional learning community: https://t.me/GyaanSetuAi
