Agent-R: மொழி மாதிரி ஏஜெண்டுகளைச் சுயசிந்தனை செய்யப் பயிற்றுவித்தல்

மொழி மாதிரி ஏஜெண்டுகள் பெரும்பாலும் தவறுகளைச் செய்கின்றன. அவை அறிவுறுத்தல்களைப் பின்பற்றினாலும், பணிகள் கடினமானதாகும்போது தோல்வியடைகின்றன.

Agent-R இந்தப் பிரச்சனையைத் தீர்க்கிறது. ஏஜெண்டுகள் எவ்வாறு சுயசிந்தனை செய்வது என்பதைக் கற்பிக்க, இது தொடர்ச்சியான சுய-பயிற்சியைப் பயன்படுத்துகிறது.

இந்தச் செயல்முறை மூன்று நிலைகளில் செயல்படுகிறது:

  • ஏஜென்ட் ஒரு பணியைச் செய்கிறது.
  • ஏஜென்ட் தனது சொந்த வேலையை ஆய்வு செய்து பிழைகளைக் கண்டறிகிறது.
  • ஏஜென்ட் இந்தத் திருத்தங்களைப் பயன்படுத்தி தனது அடுத்த முயற்சியைச் சிறப்பாக்குகிறது.

இந்த முறை சிறந்த தர்க்கரீதியான சிந்தனையை உருவாக்குகிறது. மனிதர்களின் தொடர்ச்சியான உதவி இன்றி, ஏஜென்ட் தனது சொந்தத் தோல்விகளிலிருந்து கற்றுக்கொள்கிறது.

சுய-திருத்தம் சிக்கலான பணிப்பாய்வுகளுக்கு ஏஜெண்டுகளை அதிக நம்பகத்தன்மை கொண்டதாக மாற்றுகிறது. இது தனது சொந்தத் தவறுகளைத் தானே சரிசெய்துகொள்ளும் தன்னாட்சி அமைப்புகளை நோக்கி நம்மை நெருங்கச் செய்கிறது.

ஆதாரம்: https://dev.to/paperium/agent-r-training-language-model-agents-to-reflect-via-iterative-self-training-5ggk

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi