Ajanınızın Hafızası Muhtemelen Size Yalan Söylüyor

Ajan hafızamın altı aydır çalıştığını sanıyordum.

Oturumlar arasında detayları hatırlıyordu. Projeler için bağlam çekiyordu. Hataları düzeltiyordu. Her işaret başarıya işaret ediyordu.

Yanılmışım.

Claude Code'un kendi yerleşik hafızası var. İşi yapan o sistemdi. Benim sistemim çalışıyor ve kendi deposuna yazıyordu. Meşgul görünüyordu. Farklı bir oyuncunun replikleri söylediği bir sahnede, sadece yedek oyuncu (understudy) gibiydi.

Gürültülü bir şekilde hata veren bir sistemi düzeltmek kolaydır. Hatayı görürsünüz ve harekete geçersiniz.

Sessizce hata veren bir sistem tehlikelidir. Yardımcı cevaplar üretir. Başarı gibi görünür. Çıktıya bakarak sisteminizin çalışıp çalışmadığını anlayamazsınız. Çıktı aynıdır.

Gerçeği bulmak için bir zorlayıcı fonksiyona (forcing function) ihtiyacınız var. Diğer sistemi kapatmalısınız.

Bu test, herhangi bir ajan hafızası kurulumu için geçerlidir. Sadece bir dakikanızı alır.

Şu adımları izleyin:

• Çalışma zamanınızın (runtime) yerleşik hafızasını kapatın. • Claude Code'da şu komutu kullanın: CLAUDE_CODE_DISABLE_AUTO_MEMORY=1 • Ajanınızı her zamanki gibi kullanın. • Belirli bir gerçeği hatırlamasını isteyin. • Yeni bir oturum başlatın ve o gerçeği sorun.

Sisteminizin tek başına ne yaptığını izleyin.

Eğer hafıza çalışıyorsa, sisteminiz sağlamdır.

Eğer hafıza boşalıyorsa, sizi yerleşik depo taşıyordu demektir. Verdiğiniz her demo sisteminizin değil, bir gölgenin yansımasıydı.

Bu testi yaptığımda sistemim sustu. Altı aylık başarı, aslında hatalarımı örten başka bir şeyin altı ayıydı.

Halihazırda hafızası olan bir çalışma zamanına (runtime) hafıza eklerseniz, bu riskle karşılaşırsınız. Modeller akıllandıkça, bu boşlukları daha iyi gizliyorlar. Kusursuz bir demo, sisteminizin çalıştığını kanıtlamaz. Sadece modelin başarısızlığınızı gizleyecek kadar iyi olduğunu kanıtlayabilir.

İyi cevaplara güvenmeyin. Kapatma testini (off-test) yapın. Diğer şeyi kapatın ve gerçekten kimin konuştuğunu öğrenin.

Bunu öğrenmem altı ayımı aldı. Sizin ise sadece bir dakikanızı alacak.

Kaynak: https://dev.to/hendrixxcnc/your-agents-memory-looks-like-it-works-here-is-a-one-minute-test-that-tells-you-if-it-actually-4j2c

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi