ഞാൻ എന്റെ സ്വന്തം AI ഏജന്റ് നിർമ്മിച്ചു. ആരും നിങ്ങളോട് പറയാത്ത കാര്യങ്ങൾ ഇതാ.
മിക്ക ആളുകളും AI ഏജന്റുകളെ മാന്ത്രികവിദ്യ പോലെയാണ് സംസാരിക്കുന്നത്. ഞാൻ ഒരെണ്ണം നിർമ്മിച്ചു. അത് മാന്ത്രികവിദ്യയല്ല. അത് പ്ലംബിംഗ് (അടിസ്ഥാനപരമായ ക്രമീകരണങ്ങൾ) പോലെയാണ്.
ആറുമാസം മുമ്പ് ഞാൻ AkiraAI നിർമ്മിക്കാൻ തുടങ്ങി. ഇത് എന്റെ സ്വന്തം സെർവറിൽ 24/7 പ്രവർത്തിക്കുന്ന ഒരു പേഴ്സണൽ AI ഏജന്റാണ്. ഇതൊരു ചാറ്റ്ബോട്ട് അല്ല. എന്റെ ഇമെയിലുകൾ വായിക്കുകയും, ലേഖനങ്ങൾ പ്രസിദ്ധീകരിക്കുകയും, കലണ്ടർ നിയന്ത്രിക്കുകയും, എന്റെ സെർവർ നിരീക്ഷിക്കുകയും ചെയ്യുന്ന ഒരു ഏജന്റാണിത്.
ഒരു ട്യൂട്ടോറിയലിന് പഠിപ്പിക്കാൻ കഴിയാത്ത പല കാര്യങ്ങളും ഇത് നിർമ്മിച്ചതിലൂടെ ഞാൻ പഠിച്ചു.
സാങ്കേതികവിദ്യയിലെ വിടവ് (The Gap in Tech)
എല്ലാവരും LinkedIn-ലും YouTube-ലും ഏജന്റിക് AI (agentic AI) നെ കുറിച്ച് സംസാരിക്കുന്നുണ്ട്. എന്നാൽ വളരെ കുറച്ചുപേർ മാത്രമേ അത് പൂജ്യത്തിൽ നിന്ന് നിർമ്മിക്കുകയും പ്രൊഡക്ഷനിൽ (production) പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നുള്ളൂ. ഞാൻ ആ വിടവിലേക്ക് ഇറങ്ങിച്ചെന്നു.
ടൂളുകളാണ് ഏജന്റിനെ രൂപപ്പെടുത്തുന്നത്
ഞാൻ ആദ്യമായി എന്റെ ഏജന്റിനെ Claude-മായി ബന്ധിപ്പിച്ചപ്പോൾ, അത് ഉപയോഗശൂന്യമായിരുന്നു. അതിന് ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ കഴിയുമായിരുന്നു, പക്ഷേ പ്രവർത്തിക്കാൻ കഴിയില്ലായിരുന്നു.
നിങ്ങൾ ഒരു ഏജന്റിന് ടൂളുകൾ നൽകിക്കഴിഞ്ഞാൽ മാത്രമേ അത് യഥാർത്ഥമായ ഒരു ഏജന്റായി മാറുന്നുള്ളൂ. ഞാൻ വെബ് സെർച്ച്, Gmail ആക്സസ്, Google Drive, ഷെൽ എക്സിക്യൂഷൻ (shell execution) എന്നിവ ചേർത്തു. ഒരു തത്തയും ഒരു സഹായിയും തമ്മിലുള്ള വ്യത്യാസം ഈ ടൂളുകളാണ്.
മെമ്മറി പ്രശ്നം
മെമ്മറി എന്നത് ലളിതമായ ഒന്നാണെന്നാണ് ഞാൻ കരുതിയത്. പക്ഷേ ഞാൻ തെറ്റിദ്ധരിച്ചു. നിങ്ങൾ അമിതമായ കോൺടെക്സ്റ്റ് (context) നൽകിയാൽ ടോക്കൺ പരിധികളിൽ (token limits) നിങ്ങൾ തട്ടിപ്പോകും. വളരെ കുറഞ്ഞ വിവരങ്ങൾ നൽകിയാൽ ഏജന്റ് എല്ലാം മറന്നുപോകും.
ഞാൻ മൂന്ന് പാളികളുള്ള (three-layer) ഒരു സിസ്റ്റം നിർമ്മിച്ചു:
- Short-term: ഒരു സെഷനിലെ അവസാനത്തെ കുറച്ച് സന്ദേശങ്ങൾ.
- Long-term: എന്റെ പ്രോജക്റ്റുകളെക്കുറിച്ചും താൽപ്പര്യങ്ങളെക്കുറിച്ചുമുള്ള വിവരങ്ങൾ അടങ്ങിയ ഒരു ഫയൽ.
- Lessons learned: ഏജന്റ് തെറ്റുകൾ ആവർത്തിക്കാതിരിക്കാൻ തെറ്റുകളുടെ ഒരു ലോഗ് (log).
പ്രൊഡക്ഷൻ പ്രയാസകരമാണ്
ഒരു ലാപ്ടോപ്പിൽ ഒരു ഏജന്റിനെ പ്രവർത്തിപ്പിക്കുന്നത് എളുപ്പമാണ്. എന്നാൽ ഒരു സെർവറിൽ പ്രവർത്തിപ്പിക്കുന്നത് പ്രയാസകരമാണ്. ഞാൻ യഥാർത്ഥ പ്രശ്നങ്ങൾ നേരിട്ടു:
- വെബ് ടാസ്ക്കുകൾ നടക്കുമ്പോൾ ഉണ്ടാകുന്ന RAM സ്പൈക്കുകൾ (RAM spikes).
- റിമൈൻഡറുകളെ തകരാറിലാക്കുന്ന ടൈംസോൺ പിശകുകൾ (Timezone errors).
- ക്രാഷ് ആയ പ്രോസസ്സുകളും API റേറ്റ് ലിമിറ്റുകളും (API rate limits).
മികച്ച ഏജന്റുകൾ നിർമ്മിക്കുന്നത് മികച്ച പ്രോംപ്റ്റുകൾ (prompts) ഉപയോഗിച്ചല്ല. അവ വിശ്വസനീയമായ സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗിലൂടെയാണ് നിർമ്മിക്കപ്പെടുന്നത്. അവയ്ക്ക് വേർഷനിംഗ് (versioning), മോണിറ്ററിംഗ് (monitoring), ഫോളബാക്കുകൾ (fallbacks) എന്നിവ ആവശ്യമാണ്.
അതിരുകൾ നിശ്ചയിക്കുക
ആദ്യം എനിക്ക് പൂർണ്ണമായ സ്വയംഭരണം (autonomy) വേണമായിരുന്നു. എന്നാൽ ഏജന്റ് ഒരു നിർണ്ണായക സർവീസിനെ (critical service) റീസ്റ്റാർട്ട് ചെയ്യാൻ പോയി. ഒരു സ്വയംഭരണ ഏജന്റിനെ നിർമ്മിക്കുക എന്നാൽ അത് എപ്പോൾ പ്രവർത്തിക്കരുത് എന്ന് തീരുമാനിക്കുക എന്നതാണെന്ന് ഞാൻ പഠിച്ചു. അതിരുകൾ നിശ്ചയിക്കുന്നത് നല്ലൊരു എഞ്ചിനീയറിംഗ് രീതിയാണ്.
ഫലം
ഒരു ദിവസം രാവിലെ, എന്റെ ഏജന്റിൽ നിന്നുള്ള ഒരു Telegram സന്ദേശമാണ് ഞാൻ കണ്ടത്. അത് എന്റെ ഇമെയിലുകൾ ഫ്ലാഗ് ചെയ്യുകയും, ലേഖനങ്ങൾ പ്രസിദ്ധീകരിക്കുകയും, എന്റെ സെർവർ RAM പരിശോധിക്കുകയും ചെയ്തിരുന്നു. ഞാൻ ഉറങ്ങുന്ന സമയത്തും അത് ജോലി ചെയ്തുകൊണ്ടിരുന്നു.
നിങ്ങൾക്കുള്ള എന്റെ ഉപദേശം:
- ചെറുതായി തുടങ്ങുക. ഒരു ജോലി തിരഞ്ഞെടുത്ത് അത് നന്നായി ചെയ്യുക.
- ഓരോന്നായി ടൂളുകൾ ചേർക്കുക.
- എറർ ലോഗിംഗ് (error logging), മോണിറ്ററിംഗ് (monitoring) പോലുള്ള വിരസമായ കാര്യങ്ങൾ ഒഴിവാക്കരുത്.
- എത്രയും വേഗം പ്രൊഡക്ഷനിൽ (production) പ്രവർത്തിപ്പിക്കുക.
ഈ സിസ്റ്റങ്ങൾ എങ്ങനെയാണ് പ്രവർത്തിക്കുന്നതെന്ന് മനസ്സിലാക്കാൻ ഒരു ഏജന്റിനെ നിർമ്മിക്കുക. യഥാർത്ഥ്യം അറിയാതെ തന്നെ മിക്ക ആളുകളും ഇവയെക്കുറിച്ച് സംസാരിക്കാറുണ്ട്. നിങ്ങൾ ആ മിക്ക ആളുകളിൽ ഒരാളാകരുത്.
സ്രോതസ്സ്: https://dev.to/mkautsar/i-built-my-own-ai-agent-heres-what-nobody-tells-you-3g31
ഓപ്ഷണൽ ലേണിംഗ് കമ്മ്യൂണിറ്റി: https://t.me/GyaanSetuAi