నా రూటీన్ అది రన్ అయిందని చెప్పింది. కానీ అది అబద్ధం చెప్పింది.
నేను ఒక AI సిస్టమ్ను నడుపుతున్నాను. అది తనను తాను నిర్వహించుకోవడానికి ఒక షెడ్యూల్ను అనుసరిస్తుంది. ఒక రూటీన్ ఫైల్ను సేవ్ చేయడానికి వారానికి రెండుసార్లు రన్ అవుతుంది.
షెడ్యూలర్ అది రన్ అయిందని చెప్పింది. టైమ్స్టాంప్ కూడా ఉంది. స్టేటస్ గ్రీన్ (green) లో ఉంది.
ఆ ఫైల్ అక్కడ లేదు. అది తప్పు ఫోల్డర్లో కూడా లేదు. అది ఎక్కడా లేదు.
స్వయంప్రతిపత్తి కలిగిన ఏజెంట్లను (autonomous agents) నిర్మించేటప్పుడు ప్రజలు ఈ విషయాన్ని గమనించరు. "అది రన్ అయింది" మరియు "అది పని చేసింది" అనేవి ఒకటే కావు. చాలా డ్యాష్బోర్డ్లు అది రన్ అయిందో లేదో మాత్రమే తనిఖీ చేస్తాయి.
ఒక షెడ్యూలర్ ఒక ప్రాసెస్ ప్రారంభమైందని మీకు చెబుతుంది. కానీ దాని ఫలితం గురించి ఏమీ చెప్పదు. నా రూటీన్ ప్రారంభమైంది, ఒక మిస్సింగ్ ఫైల్ను చదవడంలో లోపం (error) ఎదురై ఆగిపోయింది. అది క్రాష్ (crash) కాలేదు. ఎటువంటి ఎర్రర్ మెసేజ్ కూడా రాలేదు. అది రన్ అయింది, కానీ ఏమీ ఉత్పత్తి చేయలేదు.
నేను స్టేటస్ను చూడటం మానేశాను. నేరుగా డిస్క్ను పరిశీలించాను. నేను మూడు తనిఖీలను ఉపయోగించాను:
- అవుట్పుట్ ఫైల్ ప్రస్తుతం ఉందా?
- ఫైల్ కొత్తగా ఉందా మరియు ఖాళీగా లేదా?
- ఒకవేళ ఫైల్ లేకపోతే, రా (raw) రన్ లాగ్ను చదవండి. సమ్మరీని (summary) చదవకండి. ప్రతి టూల్ కాల్ (tool call) యొక్క అసలు ట్రాన్స్క్రిప్ట్ను చదవండి.
సమ్మరీ ఆ రూటీన్ "ఎపిసోడిక్" (episodic) అని చెప్పింది. కానీ ట్రాన్స్క్రిప్ట్ నిజం చెప్పింది. ఏజెంట్ ఒక మెమరీ ఫైల్ను చదవడానికి ప్రయత్నించింది. ఆ ఫైల్ లేదు. ఫైల్ను సృష్టించే దశకు ఏజెంట్ ఎప్పుడూ చేరుకోలేదు. అది ఒక్క రైట్ కాల్ (write call) కూడా చేయలేదు.
సమ్మరీ నన్ను తప్పు పరిష్కారం వైపు నడిపించేది.
మీరు స్వయంప్రతిపత్తి కలిగిన సిస్టమ్లను నడుపుతుంటే, ఈ నియమాలను గుర్తుంచుకోండి:
- "రన్ అయింది" అంటే "పని చేసింది" అని కాదు. ఫైలే అసలైన ఆరోగ్యం (health). ఫైల్ తప్పనిసరిగా ఉండాలి, అది కొత్తది అయి ఉండాలి మరియు ఖాళీగా ఉండకూడదు.
- స్పెసిఫికేషన్ (spec) అనేది ఒక ఊహ మాత్రమే. డిస్క్ అనేది వాస్తవం. అవి రెండూ భిన్నంగా ఉన్నప్పుడు, డిస్క్ను నమ్మండి.
- రా (raw) లాగ్ను చదవండి. ఫెయిల్ అయిన సిస్టమ్ ద్వారానే సమ్మరీ రాయబడుతుంది. ఏ టూల్స్ నిజంగా రన్ అయ్యాయో ట్రాన్స్క్రిప్ట్ చూపిస్తుంది.
పరిష్కారం చాలా సరళం. నేను రూటీన్ను మొదట దాని ఫైల్ను రాసేలా మార్చాను. ఇప్పుడు అది ఏ ఇతర దశ కంటే ముందే ఫైల్ను రాస్తుంది.
చాలా ఏజెంట్ సమస్యలు రీజనింగ్ (reasoning) వైఫల్యాలు కావు. అవి ప్లంబింగ్ (plumbing) వైఫల్యాలు.
Source: https://dev.to/eltony_lfgi/my-routine-said-it-ran-it-was-lying-2gfb
Optional learning community: https://t.me/GyaanSetuAi
