FailureDNA İnşa Etmek: Kendine Ne Zaman Güvenmemesi Gerektiğini Bilen Bir Ajan Hafızası
Çoğu yapay zeka ajanı tehlikeli bir hata yapıyor. Yeni kesintileri çözmek için geçmiş olayları kullanıyorlar. Eğer yeni bir sorun eski bir soruna benziyorsa, ajan eski çözümü kopyalıyor.
Bu bir sorun. Benzerlik, uygulanabilirlik anlamına gelmez. Geçmişteki bir çözüm eski bir veritabanı sürümünde işe yarayabilir ancak mevcut sürümünüzde başarısız olabilir. Başarısız bir çözümü tekrarlamak zaman kaybına yol açar. Eskimiş bir çözümü kullanmak ise kesintiyi daha da kötüleştirir.
Bunu çözmek için FailureDNA'yı inşa ettim. Gerçek sonuçları takip eden bir hafıza sistemidir. Geçmiş bir deneyimin yararlı olup olmadığına, incelenmesi gerekip gerekmediğine veya kaçınılması gerekip gerekmediğine karar verir.
Sistem tek bir kuralı takip eder: eylemi model seçer, ancak neyin geçerli olduğuna deterministik kod karar verir.
Nasıl çalışır: • Ajan, olay semptomlarını vektörleştirir (embed eder). • Alibaba Cloud RDS üzerindeki pgvector kullanarak geçmiş olayları arar. • Deterministik bir kapı (gate) sonuçları kontrol eder. • Model, izin verilenler listesindeki (allowlisted) bir eylemi seçer. • Sistem eylemi gerçekleştirir ve gerçek sonucu kaydeder.
Kapı üç basit kural kullanır:
- Eğer geçmiş sonuç bir başarısızlıksa: Ondan kaçının.
- Eğer geçmiş sonuç bir başarıysa ve ortam eşleşiyorsa: Onu kullanın.
- Eğer geçmiş sonuç bir başarıysa ancak ortam değiştiyse: Onu inceleyin.
Ajan, bilinen bir başarısızlığı tekrarlayamaz. Sistem, kötü eylemleri model daha görmeden önce kaldırır. Bu, modelin uyarıları görmezden gelmesini engeller. Model yaratıcılık sağlar, ancak kod güvenlik sağlar.
Teknik detaylar: • Embedding'ler ve eylem seçimi için Qwen Cloud kullandım. • text-embedding-v3, 1024-d vektörler oluşturur. • Hibrit geri çağırma (hybrid retrieval), anlamsal benzerlik ile anahtar kelime örtüşmesini birleştirir. • Backend, FastAPI ile Alibaba Cloud Function Compute üzerinde çalışır. • Hafıza, ApsaraDB RDS for PostgreSQL içinde tutulur.
FailureDNA, ajanın geçmişteki başarısızlıkları tekrarlamasını ve eskimiş çözümler kullanmasını engeller. Sistemin güvenli kalmasını sağlarken modelin yaratıcı kalmasını sağlar.
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi
