എന്റെ OpenClaw ഏജന്റ് എല്ലാ രാത്രിയും സ്വപ്നം കാണുന്നു

എല്ലാ രാത്രിയും 7:10-ന് എന്റെ OpenClaw ഏജന്റ് "ഉറങ്ങുന്നു."

അത് വിശ്രമിക്കുകയല്ല ചെയ്യുന്നത്. അത് പ്രോസസ്സ് ചെയ്യുകയാണ്. 60 സെക്കൻഡ് നീണ്ടുനിൽക്കുന്ന ഒരു സ്ക്രിപ്റ്റ്, അന്ന് ഞാൻ ചെയ്ത എല്ലാ കാര്യങ്ങൾക്കും നേരെ ഒരു പൈപ്പ്‌ലൈൻ പ്രവർത്തിപ്പിക്കുന്നു. അത് ഓരോ ടാസ്ക്കും, ഓരോ പിശകും, ഓരോ തീരുമാനവും പരിശോധിക്കുന്നു. പ്രഭാതമാകുമ്പോഴേക്കും, ഏജന്റ് അതിന്റെ മെമ്മറി എഡിറ്റ് ചെയ്തുകഴിഞ്ഞു. അത് അനാവശ്യ വിവരങ്ങൾ (noise) ഒഴിവാക്കുകയും പ്രധാനപ്പെട്ട വിവരങ്ങളെ (signal) നിലനിർത്തുകയും ചെയ്യുന്നു.

ഞാൻ ഇത് മൂന്നാഴ്ചത്തേക്ക് പ്രവർത്തിപ്പിച്ചു. ഇത് എന്തുകൊണ്ട് ഫലപ്രദമാകുന്നു എന്ന് ഈ കണക്കുകൾ കാണിച്ചുതരുന്നു:

  • ജൂൺ 23: 62 കാൻഡിഡേറ്റുകൾ സ്റ്റേജ് ചെയ്തു -> 257 തീമുകൾ കണ്ടെത്തി -> 2 മെമ്മറിയിലേക്ക് പ്രൊമോട്ട് ചെയ്തു
  • ജൂൺ 22: 64 കാൻഡിഡേറ്റുകൾ സ്റ്റേജ് ചെയ്തു -> 242 തീമുകൾ കണ്ടെത്തി -> 1 പ്രൊമോട്ട് ചെയ്തു
  • ജൂൺ 21: 63 കാൻഡിഡേറ്റുകൾ സ്റ്റേജ് ചെയ്തു -> 241 തീമുകൾ കണ്ടെത്തി -> 1 പ്രൊമോട്ട് ചെയ്തു

ഭൂരിഭാഗം ഡാറ്റയും നിരസിക്കപ്പെടുന്നു. ഇത് മനഃപൂർവ്വമാണ്.

ദീർഘകാലം പ്രവർത്തിക്കുന്ന AI ഏജന്റുകൾ കോൺടെക്സ്റ്റ് കംപ്രഷൻ (context compression) മൂലം ബുദ്ധിമുട്ടുന്നു. ഒരു സിസ്റ്റം 40 സന്ദേശങ്ങളെ ഏതാനും ഖണ്ഡികകളായി സംഗ്രഹിക്കുമ്പോൾ, അത് വിശദാംശങ്ങൾ നഷ്ടപ്പെടുത്തുന്നു. പ്രധാനപ്പെട്ട പാഠങ്ങൾ മാഞ്ഞുപോകുന്നു. തിരുത്തലുകൾ അവ്യക്തമായ ഭാഷയായി മാറുന്നു.

ഇത് പരിഹരിക്കാനാണ് ഞാൻ Dream Protocol നിർമ്മിച്ചത്. ഇത് ദൈനംദിന മെമ്മറി ലോഗുകൾ പരിശോധിക്കുന്ന ലളിതമായ ഒരു Python സ്ക്രിപ്റ്റാണ്. ഇത് പഠിച്ച ഓരോ പാഠവും ഓരോ തിരുത്തലും സ്റ്റേജ് ചെയ്യുന്നു.

എന്ത് നിലനിർത്തണം എന്ന് തീരുമാനിക്കാൻ സ്ക്രിപ്റ്റ് മൂന്ന് ഗേറ്റുകൾ ഉപയോഗിക്കുന്നു:

  • മിനിമം റീക്കോൾ കൗണ്ട് (Minimum recall count): 3 (3 തവണ പ്രത്യക്ഷപ്പെടണം)
  • മിനിമം യുണീക് ക്വറികൾ (Minimum unique queries): 3 (3 വ്യത്യസ്ത കോൺടെക്സ്റ്റുകളിൽ പ്രത്യക്ഷപ്പെടണം)
  • മിനിമം സ്കോർ (Minimum score): 0.8

ഒരു പാറ്റേൺ അതിജീവിക്കുകയാണെങ്കിൽ, അത് MEMORY.md-ലേക്ക് പോകുന്നു. ഇതാണ് ദീർഘകാല അറിവിന്റെ അടിസ്ഥാനം (long-term knowledge base).

നിരസിക്കപ്പെടുന്ന നിരക്ക് കൂടുതലാണ്. ജൂൺ 23-ന്, 828 കാൻഡിഡേറ്റുകളിൽ സ്ക്രിപ്റ്റ് 824 പേരെ നിരസിച്ചു. ഏജന്റ് പഠിക്കുന്ന കാര്യങ്ങളിൽ ഭൂരിഭാഗവും അത് മറന്നുപോകുന്നു. ആവർത്തിക്കുന്ന പാറ്റേണുകൾ മാത്രമേ അതിജീവിക്കൂ.

ഈ പ്രക്രിയ എന്റെ ഏജന്റിന്റെ പെരുമാറ്റത്തിൽ മാറ്റം വരുത്തിയിട്ടുണ്ട്. അത് ഇപ്പോൾ പിശക് പാറ്റേണുകൾ വേഗത്തിൽ തിരിച്ചറിയുന്നു. മുൻപത്തെ പരാജയങ്ങൾ ഓർമ്മിക്കുന്നത് കൊണ്ട്, പ്രൊഡക്ഷൻ ടാസ്ക്കുകൾക്കായി ഫ്രീ-ടിയർ മോഡലുകൾ നിർദ്ദേശിക്കുന്നത് അത് ഒഴിവാക്കുന്നു.

എല്ലാം സംഭരിച്ചു വെക്കുന്നത് ഒരു തെറ്റാണ്. അനാവശ്യ വിവരങ്ങൾ (noise) നിറഞ്ഞ മെമ്മറി സത്യം കണ്ടെത്തുന്നത് പ്രയാസകരമാക്കുന്നു. കോംപാക്ഷൻ (Compaction) പ്രധാനപ്പെട്ട വിവരങ്ങളുടെ (signal) തീവ്രത കുറയ്ക്കുന്നു.

നിയമം ലളിതമാണ്: നിങ്ങൾ പഠിക്കുന്നതിന്റെ 97% മറന്നുപോവുക. മൂന്ന് വ്യത്യസ്ത ദിവസങ്ങളിൽ മൂന്ന് വ്യത്യസ്ത കോൺടെക്സ്റ്റുകളിൽ പ്രത്യക്ഷപ്പെടുന്ന 3% മാത്രം നിലനിർത്തുക.

നിങ്ങളുടെ ഏജന്റിന്റെ മെമ്മറി അനാവശ്യ വിവരങ്ങൾ കൊണ്ട് നിറയുന്നുണ്ടെങ്കിൽ, എല്ലാ രാത്രിയും ഒരു ഡ്യൂപ്ലിക്കേഷൻ പാസ് (deduplication pass) ചേർക്കുക. നിങ്ങൾക്ക് സങ്കീർണ്ണമായ ടൂളുകൾ ആവശ്യമില്ല. നിങ്ങൾക്ക് ഒരു ഗേറ്റും ബാക്കിയുള്ളവ ഒഴിവാക്കാനുള്ള അച്ചടക്കവും മതി.

Source: https://dev.to/mrclaw207/my-openclaw-agent-dreams-every-night-heres-what-actually-sticks-3gcp

Optional learning community: https://t.me/GyaanSetuAi