Bir Yapay Zeka Ajanının En Zor Kısmı Mutsuz Yol Senaryolarıdır
Çoğu yapay zeka ajanı demosu kusursuz bir senaryo gösterir. Net bir soru, düzenli bir cevaba yol açar. Herkes alkışlar.
Gerçek mühendislik işler bozulduğunda gerçekleşir.
Bir API çöktüğünde ne olur? Bir ajan sonsuz döngüye girip kredi kartınızı boşalttığında ne olur? Ajanın elinde veri olmadığında ama yine de gerçek görünen bir rapor yazdığında ne olur?
Bu sorunları genomikte çözmek için BioAgent'ı geliştirdim. BioAgent; veri çeken, PubMed'de arama yapan ve klinik raporlar yazan otonom bir analisttir.
Onu inşa etmek için LangGraph ve Claude kullandım. Hata payını gözeterek geliştirme yapmak hakkında öğrendiklerim şunlar:
Her döngüyü sınırlandırın Bir ajanın kesin bir yeniden deneme sınırı olmalıdır. Eğer ajanınız ücretli API'leri çağırıyorsa, bir döngü finansal bir risktir. Bir sınır, ancak her adımda sayacı artırırsanız işe yarar. Eğer o tek satırlık kodu unutursanız, ajan sistem çökene kadar döngüye girer.
Başarıyı değil, hatayı test edin "Mutlu yol" (happy path) geliştirme aşamasında her zaman çalışır. Test sırasında bağımlılıklarınızın hata vermesini zorlamalısınız. Bir API çevrimdışı olduğunda, ajanın döngüye girmek yerine kontrollü bir şekilde performans düşürmesini doğrulayan testler yazın.
Kendinden emin saçmalamaları önleyin En büyük tehlike bir çökme değildir. Tehlike, profesyonel görünen ancak sahte veriler içeren bir rapordur. Halüsinasyonları durdurmak için sadece prompt talimatlarına güvenmeyin. Ajanın asla uydurma metrikler üretmemesini garanti altına almak için testler kullanın.
Sonuçlarınızı temellendirin Bilgi getirme (retrieval) işlemi, metin yazara ulaşmadığı sürece yararlı değildir. Sadece tam özetler yerine sadece ID'leri iletmenin, modelin alakasızlıkları uydurmasına neden olduğunu gördüm. Raporun gerçeklere dayanmasını sağlamak için metnin aslını modele iletmelisiniz.
Bir prompt'taki kural bir umuttur. Bir testteki kural ise bir garantidir.
Mutsuz yol senaryoları için inşa edin. Asıl önemli olan kısım budur.
Kaynak: https://dev.to/gbadedata/the-hardest-part-of-an-autonomous-ai-agent-is-the-unhappy-path-3p2c
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi
