𝗔𝗴𝗲𝗻𝘁-𝗥: 𝗗𝗶𝗹 𝗠𝗼𝗱𝗲𝗹𝗶 𝗔𝗷𝗮𝗻𝗹𝗮𝗿ı𝗻ı 𝗬𝗮𝗻𝘀ı𝘁𝗺𝗮 Ü𝘇𝗲𝗿𝗶𝗻𝗲 𝗘ğ𝗶𝘁𝗺𝗲𝗸

Dil modeli ajanları genellikle hatalar yapar. Talimatları takip ederler ancak görevler zorlaştığında başarısız olurlar.

Agent-R bu sorunu çözer. Ajanlara nasıl yansıtma yapacaklarını öğretmek için yinelemeli öz-eğitim kullanır.

Süreç üç adımda işler:

  • Ajan bir görevi yerine getirir.
  • Ajan, hataları bulmak için kendi çalışmasını inceler.
  • Ajan, bir sonraki denemesini iyileştirmek için bu düzeltmeleri kullanır.

Bu yöntem daha iyi bir muhakeme yeteneği oluşturur. Ajan, sürekli insan yardımına ihtiyaç duymadan kendi hatalarından öğrenir.

Öz-düzeltme, ajanları karmaşık iş akışları için daha güvenilir hale getirir. Bizi, kendi hatalarını düzelten otonom sistemlere bir adım daha yaklaştırır.

Kaynak: https://dev.to/paperium/agent-r-training-language-model-agents-to-reflect-via-iterative-self-training-5ggk

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi