మీ ఏజెంట్ మెమరీ బహుశా మీకు అబద్ధం చెబుతోంది

నా ఏజెంట్ మెమరీ ఆరు నెలల పాటు సరిగ్గా పనిచేస్తుందని నేను అనుకున్నాను.

అది వివిధ సెషన్ల మధ్య వివరాలను గుర్తుంచుకుంది. ప్రాజెక్టుల కోసం కాంటెక్స్ట్‌ను సేకరించింది. తప్పులను సరిదిద్దింది. ప్రతి సంకేతం విజయాన్ని సూచిస్తోంది.

నేను పొరబడ్డాను.

Claude Code కి దాని స్వంత బిల్ట్-ఇన్ మెమరీ ఉంది. ఆ సిస్టమే పనిని చేస్తోంది. నా సిస్టమ్ నడుస్తూ తన సొంత స్టోర్‌కు డేటాను రాస్తోంది. అది పని చేస్తున్నట్లు కనిపిస్తోంది. కానీ అది ఒక వేదికపై వేరే నటుడు డైలాగులు చెబుతుంటే, పక్కన నిలబడిన అండర్‌స్టడీ (understudy) లాంటిది.

పెద్దగా శబ్దం చేస్తూ విఫలమయ్యే సిస్టమ్‌ను సరిదిద్దడం సులభం. మీరు ఆ లోపాన్ని చూసి చర్య తీసుకోవచ్చు.

నిశ్శబ్దంగా విఫలమయ్యే సిస్టమ్ ప్రమాదకరమైనది. అది ఉపయోగకరమైన సమాధానాలను ఇస్తుంది. అది విజయవంతంగా కనిపిస్తుంది. అవుట్‌పుట్‌ను చూసి మీ సిస్టమ్ పనిచేస్తుందో లేదో మీరు చెప్పలేరు. అవుట్‌పుట్ మాత్రం ఒకేలా ఉంటుంది.

నిజం తెలుసుకోవడానికి మీకు ఒక బలమైన పరీక్ష (forcing function) అవసరం. మీరు ఆ ఇతర సిస్టమ్‌ను ఆపివేయాలి.

ఈ పరీక్ష ఏ ఏజెంట్ మెమరీ సెటప్‌కైనా పనిచేస్తుంది. దీనికి కేవలం ఒక నిమిషం పడుతుంది.

ఈ దశలను అనుసరించండి:

• మీ రన్‌టైమ్ యొక్క నేటివ్ మెమరీని ఆపివేయండి. • Claude Codeలో, ఈ కమాండ్‌ను ఉపయోగించండి: CLAUDE_CODE_DISABLE_AUTO_MEMORY=1 • మీ ఏజెంట్‌ను యథావిధిగా ఉపయోగించండి. • ఏదైనా ఒక నిర్దిష్ట విషయాన్ని గుర్తుంచుకోమని దానికి చెప్పండి. • కొత్త సెషన్‌ను ప్రారంభించి, ఆ విషయాన్ని అడగండి.

మీ సిస్టమ్ ఒంటరిగా ఏం చేస్తుందో గమనించండి.

మెమరీ పనిచేస్తే, మీ సిస్టమ్ బలంగా ఉన్నట్లు.

మెమరీ ఖాళీ అయిపోతే, నేటివ్ స్టోరే మిమ్మల్ని నడిపిస్తోంది అని అర్థం. మీరు ఇచ్చిన ప్రతి డెమో మీ సిస్టమ్ యొక్క నీడ మాత్రమే, అది మీ సిస్టమ్ కాదు.

నేను ఈ పరీక్ష చేసినప్పుడు, నా సిస్టమ్ నిశ్శబ్దంగా మారిపోయింది. ఆరు నెలల విజయం అనేది నిజానికి నా తప్పులను వేరే ఏదో ఒకటి కప్పిపుచ్చిన ఆరు నెలలు మాత్రమే.

ఇప్పటికే మెమరీ ఉన్న రన్‌టైమ్‌కు మీరు మళ్ళీ మెమరీని జోడిస్తే, మీరు ఈ రిస్క్‌ను ఎదుర్కొంటారు. మోడల్స్ మరింత తెలివైనవిగా మారుతున్న కొద్దీ, అవి ఈ లోపాలను మరింత మెరుగ్గా దాచిపెడతాయి. ఒక చక్కని డెమో మీ సిస్టమ్ పనిచేస్తుందని నిరూపించదు. అది కేవలం మీ వైఫల్యాన్ని దాచడానికి మోడల్ సరిపోతుందని మాత్రమే నిరూపించవచ్చు.

మంచి సమాధానాలను నమ్మకండి. 'ఆఫ్-టెస్ట్' (off-test) చేయండి. ఆ ఇతర అంశాన్ని ఆపివేసి, నిజంగా ఎవరు మాట్లాడుతున్నారో తెలుసుకోండి.

ఇది నేర్చుకోవడానికి నాకు ఆరు నెలలు పట్టింది. మీకు ఒక నిమిషం పడుతుంది.

Source: https://dev.to/hendrixxcnc/your-agents-memory-looks-like-it-works-here-is-a-one-minute-test-that-tells-you-if-it-actually-4j2c

Optional learning community: https://t.me/GyaanSetuAi