ਮੇਰਾ OpenClaw Agent ਹਰ ਰਾਤ ਸੁਪਨੇ ਦੇਖਦਾ ਹੈ
ਹਰ ਰਾਤ 7:10 ਵਜੇ, ਮੇਰਾ OpenClaw agent "ਸੌਂਦਾ" ਹੈ।
ਇਹ ਆਰਾਮ ਨਹੀਂ ਕਰਦਾ। ਇਹ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਦਾ ਹੈ। ਇੱਕ 60-ਸਕਿੰਟ ਦਾ ਸਕ੍ਰਿਪਟ ਉਸ ਦਿਨ ਮੇਰੇ ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਹਰ ਕੰਮ ਦੇ ਵਿਰੁੱਧ ਇੱਕ ਪਾਈਪਲਾਈਨ ਚਲਾਉਂਦਾ ਹੈ। ਇਹ ਹਰ ਟਾਸਕ, ਹਰ ਗਲਤੀ ਅਤੇ ਹਰ ਫੈਸਲੇ ਨੂੰ ਦੇਖਦਾ ਹੈ। ਸਵੇਰ ਤੱਕ, agent ਨੇ ਆਪਣੀ ਯਾਦਦਾਸ਼ਤ ਨੂੰ ਐਡਿਟ ਕਰ ਲਿਆ ਹੁੰਦਾ ਹੈ। ਇਹ ਫਾਲਤੂ ਜਾਣਕਾਰੀ (noise) ਨੂੰ ਰੱਦ ਕਰ ਦਿੰਦਾ ਹੈ ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ (signal) ਨੂੰ ਅੱਗੇ ਵਧਾਉਂਦਾ ਹੈ।
ਮੈਂ ਇਸਨੂੰ ਤਿੰਨ ਹਫ਼ਤਿਆਂ ਤੱਕ ਚਲਾਇਆ। ਅੰਕ ਦੱਸਦੇ ਹਨ ਕਿ ਇਹ ਕਿਉਂ ਕੰਮ ਕਰਦਾ ਹੈ:
- 23 ਜੂਨ: 62 candidates ਸਟੇਜ ਕੀਤੇ ਗਏ -> 257 ਥੀਮ ਮਿਲੇ -> 2 ਨੂੰ ਮੈਮੋਰੀ ਵਿੱਚ ਭੇਜਿਆ ਗਿਆ
- 22 ਜੂਨ: 64 candidates ਸਟੇਜ ਕੀਤੇ ਗਏ -> 242 ਥੀਮ ਮਿਲੇ -> 1 ਨੂੰ ਭੇਜਿਆ ਗਿਆ
- 21 ਜੂਨ: 63 candidates ਸਟੇਜ ਕੀਤੇ ਗਏ -> 241 ਥੀਮ ਮਿਲੇ -> 1 ਨੂੰ ਭੇਜਿਆ ਗਿਆ
ਜ਼ਿਆਦਾਤਰ ਡੇਟਾ ਰੱਦ ਕਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਜਾਣਬੁੱਝ ਕੇ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਲੰਬੇ ਸਮੇਂ ਤੱਕ ਚੱਲਣ ਵਾਲੇ AI agents 'context compression' ਦਾ ਸ਼ਿਕਾਰ ਹੁੰਦੇ ਹਨ। ਜਦੋਂ ਕੋਈ ਸਿਸਟਮ 40 ਸੁਨੇਹਿਆਂ ਨੂੰ ਕੁਝ ਪੈਰਾਗ੍ਰਾਫਾਂ ਵਿੱਚ ਸੰਖੇਪ ਕਰਦਾ ਹੈ, ਤਾਂ ਇਹ ਵਿਸਤਾਰ ਗੁਆ ਲੈਂਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਸਬਕ ਧੁੰਦਲੇ ਹੋ ਜਾਂਦੇ ਹਨ। ਸੁਧਾਰ ਅਸਪਸ਼ਟ ਭਾਸ਼ਾ ਵਿੱਚ ਬਦਲ ਜਾਂਦੇ ਹਨ।
ਮੈਂ ਇਸ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ Dream Protocol ਬਣਾਇਆ ਹੈ। ਇਹ ਇੱਕ ਸਧਾਰਨ Python ਸਕ੍ਰਿਪਟ ਹੈ ਜੋ ਰੋਜ਼ਾਨਾ ਮੈਮੋਰੀ ਲੌਗਸ ਨੂੰ ਸਕੈਨ ਕਰਦੀ ਹੈ। ਇਹ ਸਿੱਖੇ ਹੋਏ ਹਰ ਸਬਕ ਅਤੇ ਹਰ ਸੁਧਾਰ ਨੂੰ ਸਟੇਜ ਕਰਦੀ ਹੈ।
ਸਕ੍ਰਿਪਟ ਇਹ ਫੈਸਲਾ ਕਰਨ ਲਈ ਤਿੰਨ ਗੇਟਾਂ (gates) ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ:
- ਘੱਟੋ-ਘੱਟ recall count: 3 (3 ਵਾਰ ਦਿਖਾਈ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ)
- ਘੱਟੋ-ਘੱਟ unique queries: 3 (3 ਵੱਖ-ਵੱਖ ਸੰਦਰਭਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ)
- ਘੱਟੋ-ਘੱਟ score: 0.8
ਜੇਕਰ ਕੋਈ ਪੈਟਰਨ ਬਚ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਹ MEMORY.md ਵਿੱਚ ਜਾਂਦਾ ਹੈ। ਇਹ ਲੰਬੇ ਸਮੇਂ ਦਾ ਗਿਆਨ ਅਧਾਰ (knowledge base) ਹੈ।
ਰੱਦ ਕਰਨ ਦੀ ਦਰ ਉੱਚੀ ਹੈ। 23 ਜੂਨ ਨੂੰ, ਸਕ੍ਰਿਪਟ ਨੇ 828 candidates ਵਿੱਚੋਂ 824 ਨੂੰ ਰੱਦ ਕਰ ਦਿੱਤਾ। Agent ਜੋ ਕੁਝ ਵੀ ਸਿੱਖਦਾ ਹੈ, ਉਸ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ ਭੁੱਲ ਜਾਂਦਾ ਹੈ। ਸਿਰਫ਼ ਉਹੀ ਪੈਟਰਨ ਬਚਦੇ ਹਨ ਜੋ ਦੁਹਰਾਏ ਜਾਂਦੇ ਹਨ।
ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੇ ਮੇਰੇ agent ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ। ਇਹ ਹੁਣ ਗਲਤੀਆਂ ਦੇ ਪੈਟਰਨਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪਛਾਣਦਾ ਹੈ। ਇਹ production ਕੰਮਾਂ ਲਈ free-tier ਮਾਡਲਾਂ ਦੀ ਸਲਾਹ ਦੇਣਾ ਬੰਦ ਕਰ ਦਿੰਦਾ ਹੈ ਕਿਉਂਕਿ ਇਸਨੂੰ ਪਿਛਲੀਆਂ ਅਸਫਲਤਾਵਾਂ ਯਾਦ ਹਨ।
ਸਭ ਕੁਝ ਸਟੋਰ ਕਰਨਾ ਇੱਕ ਗਲਤੀ ਹੈ। ਫਾਲਤੂ ਜਾਣਕਾਰੀ (noise) ਨਾਲ ਭਰੀ ਮੈਮੋਰੀ ਸੱਚ ਲੱਭਣਾ ਮੁਸ਼ਕਲ ਬਣਾ ਦਿੰਦੀ ਹੈ। Compaction ਸਿਗਨਲ ਨੂੰ ਘਟਾ ਦਿੰਦੀ ਹੈ।
ਨਿਯਮ ਸਧਾਰਨ ਹੈ: ਜੋ ਤੁਸੀਂ ਸਿੱਖਦੇ ਹੋ ਉਸਦਾ 97% ਭੁੱਲ ਜਾਓ। ਸਿਰਫ਼ ਉਹ 3% ਰੱਖੋ ਜੋ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਦਿਨਾਂ 'ਤੇ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਸੰਦਰਭਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
ਜੇਕਰ ਤੁਹਾਡੇ agent ਦੀ ਮੈਮੋਰੀ ਵਿੱਚ ਫਾਲਤੂ ਜਾਣਕਾਰੀ ਵਧ ਰਹੀ ਹੈ, ਤਾਂ ਰਾਤ ਨੂੰ ਇੱਕ nightly deduplication pass ਜੋੜੋ। ਤੁਹਾਨੂੰ ਗੁੰਝਲਦਾਰ ਸਾਧਨਾਂ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਇੱਕ ਗੇਟ ਅਤੇ ਬਾਕੀ ਸਭ ਕੁਝ ਮਿਟਾਉਣ ਦੇ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਹੈ।
Source: https://dev.to/mrclaw207/my-openclaw-agent-dreams-every-night-heres-what-actually-sticks-3gcp
Optional learning community: https://t.me/GyaanSetuAi
