Şu Anki En Popüler Yapay Zeka Çerçevesinin Ölümcül Bir Kusuru Var
Artık herkes her şeye bir ajan (agent) diyor.
Bir aracı çağıran bir fonksiyon bir ajandır. Hafızası olan bir chatbot bir ajandır. Döngüsü olan bir script bir ajandır. Bu bir hatadır.
Net bir tanımınız olmadığında, basit görevleri gereğinden fazla karmaşıklaştırıyorsunuz (over-engineer). Karmaşık olanları ise yetersiz tasarlıyorsunuz (under-engineer). Sadece tek bir iyi prompt'a ihtiyaç duyan iş akışları için ekiplerin haftalarca ajan tabanlı orkestrasyon (agentic orchestration) üzerinde çalıştığını görüyorum.
Bir ajanın sadece bir talimata değil, bir hedefe ihtiyacı vardır. Bir ajan bir sonraki adımda ne yapacağına karar verir. Hataları yönetir. Ne zaman işinin bittiğini bilir.
- Eğer bir insan sisteme her adımı söylüyorsa, bu bir sohbet arayüzüdür.
- Eğer bir sistem başarısız bir araç çağrısından sonra kendini toparlayabiliyorsa, ilerleme kaydediyorsunuz demektir.
- Eğer bir sistem bir hedefi alt görevlere bölüyorsa, bu gerçek bir ajandır.
En başarılı ajanlar dar kapsamlıdır. Bir işi iyi yaparlar. Müşteri desteği veya belge çıkarımı gibi işleri yönetirler. Genel muhakeme motorları değillerdir.
Başarılı ekipler şu üç alana odaklanır:
- Araç tasarımı: Arayüz ne kadar temiz?
- Hata yönetimi: Bir araç hiçbir şey döndürmediğinde ne olur?
- Gözlemlenebilirlik: Ajanın neden bir karar verdiğini takip edebiliyor musunuz?
Mimariyi değiştirmeden modelleri değiştiren ve daha iyi sonuçlar bekleyen ekipler başarısız olacaktır.
LangChain veya CrewAI gibi çerçeveler, desenlerden (patterns) daha az önem taşır. Desenler, araçtan bağımsız olarak çalışır.
Şu desenleri kullanın:
- Önce planla, sonra uygula: Planlamak için bir adım, uygulamak için ayrı bir adım kullanın.
- Retrieval'ı (geri çağırma) reasoning'den (muhakeme) ayırın: Veri çekmek ve veriyi kullanmak farklı işlerdir.
- Açık devirler (handoffs): Bir ajan işi diğerine devrettiğinde yapılandırılmış loglar kullanın.
Çerçeve iskeledir. Mimari ise binadır.
RAG da bir başarısızlık kaynağıdır. Çoğu insan chunking (parçalama) işlemini yanlış yapıyor. Eğer bir belgeyi kötü bir şekilde bölerseniz, model bağlamı (context) kaybeder.
Eğer RAG'ınız doğru ama işe yaramaz sonuçlar döndürüyorsa, chunking işleminizi veya meta verilerinizi düzeltin. Embedding modelini suçlamayın.
Benchmark'ların peşinden koşmayı bırakın. Güvenebileceğiniz sistemler inşa etmeye odaklanın. Yönetişime, gözlemlenebilirliğe ve güvenilir araç kullanımına odaklanın.
Önemli olan mühendisler, başkalarının bakımını yapabileceği sistemler inşa edenler olacaktır. Bu model araştırması değil, sistem tasarımıdır.
Kaynak: https://dev.to/aibughunter/the-hottest-ai-framework-right-now-has-a-fatal-flaw-nobody-mentions-3hd1
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi