AI ஏஜென்ட்கள் (AI Agents) என்றால் என்ன?
நான் ஒருமுறை இஸ்தான்புல்லுக்கு ஒரு பயணத்தைத் திட்டமிட ChatGPT-இடம் கேட்டேன். அது எனக்கு ஒரு சிறந்த திட்டத்தைக் கொடுத்தது. ஆனால் அதனால் விமானப் பயணங்களை முன்பதிவு செய்ய முடியவில்லை. ஹோட்டல் விலைகளைச் சரிபார்க்க முடியவில்லை. மின்னஞ்சல் அனுப்ப முடியவில்லை.
அந்த மாடல் புத்திசாலித்தனமாக இருந்தது, ஆனால் அதற்கு கைகள் இல்லை. அதனால் சிந்திக்க முடிந்தது, ஆனால் செயல்பட முடியவில்லை.
AI ஏஜென்ட்கள் இந்தப் பிரச்சனையைத் தீர்க்கின்றன.
சாதாரண LLMs (Large Language Models) நன்கு படித்த ஒரு உதவியாளரைப் போலச் செயல்படுகின்றன. நீங்கள் ஒரு ப்ராம்ப்ட் (prompt) அனுப்பினால், மாடல் ஒரு பதிலை அனுப்பும். அது ஒரு முறை மட்டுமே நடக்கும் செயல்முறை. அந்த மாடல் இணையத்தைத் தேடாது, உங்கள் காலண்டரைச் சரிபார்க்காது அல்லது நிஜ உலகில் எந்தச் செயல்களையும் செய்யாது.
ஒரு AI ஏஜென்ட் வித்தியாசமானது. ஒரு ஏஜென்ட் தனது இலக்கை அடைய எந்தக் கருவிகளைப் பயன்படுத்த வேண்டும் என்பதைத் தீர்மானிக்க ஒரு மொழி மாதிரியைப் (language model) பயன்படுத்துகிறது.
ஒரு ஏஜென்ட் can:
- இணையத்தைத் தேடுதல்
- குறியீட்டை (code) இயக்குதல்
- தரவுத்தளத்தைத் (database) தேடுதல்
- மின்னஞ்சல்களை அனுப்புதல்
- வெளிப்புற API-களைப் பயன்படுத்துதல்
இதன் முக்கிய வேறுபாடு அதன் தன்னாட்சித் திறன் (autonomy) ஆகும். நீங்கள் ஒரு ஏஜென்ட்டிடம் ஒரு இலக்கைக் கொடுத்தால், அது அதற்கான வழிமுறைகளைக் கண்டறியும்.
ஒப்பீடு: • சாதாரண LLM: கேள்விகளுக்குப் பதிலளிக்கும், ஒற்றை பதில், கருவிகள் இல்லை, எதிர்வினை ஆற்றும் தன்மை கொண்டது (reactive). • AI ஏஜென்ட்: செயலில் இறங்கும், பல படிநிலைகளைக் கொண்ட தர்க்கம் (multi-step reasoning), கருவிகளைப் பயன்படுத்தும், இலக்கை நோக்கியது.
பெரும்பாலான ஏஜென்ட்கள் ReAct (Reason and Act) எனப்படும் முறையைப் பயன்படுத்துகின்றன. இது ஒரு எளிய சுழற்சியைப் பின்பற்றுகிறது:
- சிந்தனை (Thought): அடுத்து நான் என்ன செய்ய வேண்டும்?
- செயல் (Action): ஒரு கருவியைப் பயன்படுத்துதல்.
- கவனித்தல் (Observe): முடிவைப் பார்த்தல்.
- மீண்டும் செய்தல் (Repeat): இலக்கு அடையும் வரை தொடர்தல்.
இத்தகைய சுழற்சிகளை உருவாக்குவது கடினம். நீங்கள் பிழைகளைக் கையாள வேண்டும், நினைவகத்தை (memory) நிர்வகிக்க வேண்டும் மற்றும் கருவிகளை இணைக்க வேண்டும்.
இதனால்தான் LangChain போன்ற கட்டமைப்புகள் (frameworks) உள்ளன. LangChain இதற்கான அடிப்படை கட்டமைப்பை (plumbing) வழங்குகிறது. இது உங்களுக்கு முன்பே உருவாக்கப்பட்ட கருவிகள், நினைவகம் மற்றும் மாடல்களை நிஜ உலகத்துடன் இணைப்பதற்கான வழிகளை வழங்குகிறது.
உங்கள் பணிப்பாய்வு (workflow) சிக்கலானதாக இருந்தால், நீங்கள் LangGraph-ஐப் பயன்படுத்தலாம். LangGraph வெவ்வேறு பாதைகளில் பிரியக்கூடிய, பணிகளை இணையாகச் செய்யக்கூடிய அல்லது முந்தைய படிநிலைகளுக்குத் திரும்பக்கூடிய ஏஜென்ட்களை உருவாக்க உங்களுக்கு உதவுகிறது.
சுருக்கம்:
- LLMs உரைகளுக்குப் பதிலளிக்கின்றன.
- ஏஜென்ட்கள் பணிகளை முடிக்கக் கருவிகளைப் பயன்படுத்துகின்றன.
- ReAct சுழற்சி ஏஜென்ட்டின் தர்க்கத்தை இயக்குகிறது.
- LangChain மாடல்களுக்கும் கருவிகளுக்கும் இடையிலான இணைப்பை நிர்வகிக்கிறது.
- LangGraph சிக்கலான, கிளைகளாகப் பிரியும் பணிப்பாய்வுகளைக் கையாள்கிறது.
எனது அடுத்த பதிவில், உங்கள் சூழலை (environment) எவ்வாறு அமைப்பது மற்றும் உங்கள் முதல் ஏஜென்ட்டை எவ்வாறு இயக்குவது என்பதைக் காண்பிப்பேன்.
Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd
Optional learning community: https://t.me/GyaanSetuAi