AI ஏஜென்ட்கள் (AI Agents) என்றால் என்ன?

நான் ஒருமுறை இஸ்தான்புல்லுக்கு ஒரு பயணத்தைத் திட்டமிட ChatGPT-இடம் கேட்டேன். அது எனக்கு ஒரு சிறந்த திட்டத்தைக் கொடுத்தது. ஆனால் அதனால் விமானப் பயணங்களை முன்பதிவு செய்ய முடியவில்லை. ஹோட்டல் விலைகளைச் சரிபார்க்க முடியவில்லை. மின்னஞ்சல் அனுப்ப முடியவில்லை.

அந்த மாடல் புத்திசாலித்தனமாக இருந்தது, ஆனால் அதற்கு கைகள் இல்லை. அதனால் சிந்திக்க முடிந்தது, ஆனால் செயல்பட முடியவில்லை.

AI ஏஜென்ட்கள் இந்தப் பிரச்சனையைத் தீர்க்கின்றன.

சாதாரண LLMs (Large Language Models) நன்கு படித்த ஒரு உதவியாளரைப் போலச் செயல்படுகின்றன. நீங்கள் ஒரு ப்ராம்ப்ட் (prompt) அனுப்பினால், மாடல் ஒரு பதிலை அனுப்பும். அது ஒரு முறை மட்டுமே நடக்கும் செயல்முறை. அந்த மாடல் இணையத்தைத் தேடாது, உங்கள் காலண்டரைச் சரிபார்க்காது அல்லது நிஜ உலகில் எந்தச் செயல்களையும் செய்யாது.

ஒரு AI ஏஜென்ட் வித்தியாசமானது. ஒரு ஏஜென்ட் தனது இலக்கை அடைய எந்தக் கருவிகளைப் பயன்படுத்த வேண்டும் என்பதைத் தீர்மானிக்க ஒரு மொழி மாதிரியைப் (language model) பயன்படுத்துகிறது.

ஒரு ஏஜென்ட் can:

  • இணையத்தைத் தேடுதல்
  • குறியீட்டை (code) இயக்குதல்
  • தரவுத்தளத்தைத் (database) தேடுதல்
  • மின்னஞ்சல்களை அனுப்புதல்
  • வெளிப்புற API-களைப் பயன்படுத்துதல்

இதன் முக்கிய வேறுபாடு அதன் தன்னாட்சித் திறன் (autonomy) ஆகும். நீங்கள் ஒரு ஏஜென்ட்டிடம் ஒரு இலக்கைக் கொடுத்தால், அது அதற்கான வழிமுறைகளைக் கண்டறியும்.

ஒப்பீடு: • சாதாரண LLM: கேள்விகளுக்குப் பதிலளிக்கும், ஒற்றை பதில், கருவிகள் இல்லை, எதிர்வினை ஆற்றும் தன்மை கொண்டது (reactive). • AI ஏஜென்ட்: செயலில் இறங்கும், பல படிநிலைகளைக் கொண்ட தர்க்கம் (multi-step reasoning), கருவிகளைப் பயன்படுத்தும், இலக்கை நோக்கியது.

பெரும்பாலான ஏஜென்ட்கள் ReAct (Reason and Act) எனப்படும் முறையைப் பயன்படுத்துகின்றன. இது ஒரு எளிய சுழற்சியைப் பின்பற்றுகிறது:

  1. சிந்தனை (Thought): அடுத்து நான் என்ன செய்ய வேண்டும்?
  2. செயல் (Action): ஒரு கருவியைப் பயன்படுத்துதல்.
  3. கவனித்தல் (Observe): முடிவைப் பார்த்தல்.
  4. மீண்டும் செய்தல் (Repeat): இலக்கு அடையும் வரை தொடர்தல்.

இத்தகைய சுழற்சிகளை உருவாக்குவது கடினம். நீங்கள் பிழைகளைக் கையாள வேண்டும், நினைவகத்தை (memory) நிர்வகிக்க வேண்டும் மற்றும் கருவிகளை இணைக்க வேண்டும்.

இதனால்தான் LangChain போன்ற கட்டமைப்புகள் (frameworks) உள்ளன. LangChain இதற்கான அடிப்படை கட்டமைப்பை (plumbing) வழங்குகிறது. இது உங்களுக்கு முன்பே உருவாக்கப்பட்ட கருவிகள், நினைவகம் மற்றும் மாடல்களை நிஜ உலகத்துடன் இணைப்பதற்கான வழிகளை வழங்குகிறது.

உங்கள் பணிப்பாய்வு (workflow) சிக்கலானதாக இருந்தால், நீங்கள் LangGraph-ஐப் பயன்படுத்தலாம். LangGraph வெவ்வேறு பாதைகளில் பிரியக்கூடிய, பணிகளை இணையாகச் செய்யக்கூடிய அல்லது முந்தைய படிநிலைகளுக்குத் திரும்பக்கூடிய ஏஜென்ட்களை உருவாக்க உங்களுக்கு உதவுகிறது.

சுருக்கம்:

  • LLMs உரைகளுக்குப் பதிலளிக்கின்றன.
  • ஏஜென்ட்கள் பணிகளை முடிக்கக் கருவிகளைப் பயன்படுத்துகின்றன.
  • ReAct சுழற்சி ஏஜென்ட்டின் தர்க்கத்தை இயக்குகிறது.
  • LangChain மாடல்களுக்கும் கருவிகளுக்கும் இடையிலான இணைப்பை நிர்வகிக்கிறது.
  • LangGraph சிக்கலான, கிளைகளாகப் பிரியும் பணிப்பாய்வுகளைக் கையாள்கிறது.

எனது அடுத்த பதிவில், உங்கள் சூழலை (environment) எவ்வாறு அமைப்பது மற்றும் உங்கள் முதல் ஏஜென்ட்டை எவ்வாறு இயக்குவது என்பதைக் காண்பிப்பேன்.

Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd

Optional learning community: https://t.me/GyaanSetuAi