ഞാൻ എന്റെ സ്വന്തം AI ഏജന്റ് നിർമ്മിച്ചു. ആരും നിങ്ങളോട് പറയാത്ത കാര്യങ്ങൾ ഇതാ.

📅3 hours ago⏱2 min read

In this article

മിക്ക ആളുകളും AI ഏജന്റുകളെ മാന്ത്രികവിദ്യ പോലെയാണ് സംസാരിക്കുന്നത്. ഞാൻ ഒരെണ്ണം നിർമ്മിച്ചു. അത് മാന്ത്രികവിദ്യയല്ല. അത് പ്ലംബിംഗ് (അടിസ്ഥാനപരമായ ക്രമീകരണങ്ങൾ) പോലെയാണ്.

ആറുമാസം മുമ്പ് ഞാൻ AkiraAI നിർമ്മിക്കാൻ തുടങ്ങി. ഇത് എന്റെ സ്വന്തം സെർവറിൽ 24/7 പ്രവർത്തിക്കുന്ന ഒരു പേഴ്സണൽ AI ഏജന്റാണ്. ഇതൊരു ചാറ്റ്ബോട്ട് അല്ല. എന്റെ ഇമെയിലുകൾ വായിക്കുകയും, ലേഖനങ്ങൾ പ്രസിദ്ധീകരിക്കുകയും, കലണ്ടർ നിയന്ത്രിക്കുകയും, എന്റെ സെർവർ നിരീക്ഷിക്കുകയും ചെയ്യുന്ന ഒരു ഏജന്റാണിത്.

ഒരു ട്യൂട്ടോറിയലിന് പഠിപ്പിക്കാൻ കഴിയാത്ത പല കാര്യങ്ങളും ഇത് നിർമ്മിച്ചതിലൂടെ ഞാൻ പഠിച്ചു.

സാങ്കേതികവിദ്യയിലെ വിടവ് (The Gap in Tech)

എല്ലാവരും LinkedIn-ലും YouTube-ലും ഏജന്റിക് AI (agentic AI) നെ കുറിച്ച് സംസാരിക്കുന്നുണ്ട്. എന്നാൽ വളരെ കുറച്ചുപേർ മാത്രമേ അത് പൂജ്യത്തിൽ നിന്ന് നിർമ്മിക്കുകയും പ്രൊഡക്ഷനിൽ (production) പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നുള്ളൂ. ഞാൻ ആ വിടവിലേക്ക് ഇറങ്ങിച്ചെന്നു.

ടൂളുകളാണ് ഏജന്റിനെ രൂപപ്പെടുത്തുന്നത്

ഞാൻ ആദ്യമായി എന്റെ ഏജന്റിനെ Claude-മായി ബന്ധിപ്പിച്ചപ്പോൾ, അത് ഉപയോഗശൂന്യമായിരുന്നു. അതിന് ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ കഴിയുമായിരുന്നു, പക്ഷേ പ്രവർത്തിക്കാൻ കഴിയില്ലായിരുന്നു.

നിങ്ങൾ ഒരു ഏജന്റിന് ടൂളുകൾ നൽകിക്കഴിഞ്ഞാൽ മാത്രമേ അത് യഥാർത്ഥമായ ഒരു ഏജന്റായി മാറുന്നുള്ളൂ. ഞാൻ വെബ് സെർച്ച്, Gmail ആക്സസ്, Google Drive, ഷെൽ എക്സിക്യൂഷൻ (shell execution) എന്നിവ ചേർത്തു. ഒരു തത്തയും ഒരു സഹായിയും തമ്മിലുള്ള വ്യത്യാസം ഈ ടൂളുകളാണ്.

മെമ്മറി പ്രശ്നം

മെമ്മറി എന്നത് ലളിതമായ ഒന്നാണെന്നാണ് ഞാൻ കരുതിയത്. പക്ഷേ ഞാൻ തെറ്റിദ്ധരിച്ചു. നിങ്ങൾ അമിതമായ കോൺടെക്സ്റ്റ് (context) നൽകിയാൽ ടോക്കൺ പരിധികളിൽ (token limits) നിങ്ങൾ തട്ടിപ്പോകും. വളരെ കുറഞ്ഞ വിവരങ്ങൾ നൽകിയാൽ ഏജന്റ് എല്ലാം മറന്നുപോകും.

ഞാൻ മൂന്ന് പാളികളുള്ള (three-layer) ഒരു സിസ്റ്റം നിർമ്മിച്ചു:

Short-term: ഒരു സെഷനിലെ അവസാനത്തെ കുറച്ച് സന്ദേശങ്ങൾ.
Long-term: എന്റെ പ്രോജക്റ്റുകളെക്കുറിച്ചും താൽപ്പര്യങ്ങളെക്കുറിച്ചുമുള്ള വിവരങ്ങൾ അടങ്ങിയ ഒരു ഫയൽ.
Lessons learned: ഏജന്റ് തെറ്റുകൾ ആവർത്തിക്കാതിരിക്കാൻ തെറ്റുകളുടെ ഒരു ലോഗ് (log).

പ്രൊഡക്ഷൻ പ്രയാസകരമാണ്

ഒരു ലാപ്ടോപ്പിൽ ഒരു ഏജന്റിനെ പ്രവർത്തിപ്പിക്കുന്നത് എളുപ്പമാണ്. എന്നാൽ ഒരു സെർവറിൽ പ്രവർത്തിപ്പിക്കുന്നത് പ്രയാസകരമാണ്. ഞാൻ യഥാർത്ഥ പ്രശ്നങ്ങൾ നേരിട്ടു:

വെബ് ടാസ്ക്കുകൾ നടക്കുമ്പോൾ ഉണ്ടാകുന്ന RAM സ്പൈക്കുകൾ (RAM spikes).
റിമൈൻഡറുകളെ തകരാറിലാക്കുന്ന ടൈംസോൺ പിശകുകൾ (Timezone errors).
ക്രാഷ് ആയ പ്രോസസ്സുകളും API റേറ്റ് ലിമിറ്റുകളും (API rate limits).

മികച്ച ഏജന്റുകൾ നിർമ്മിക്കുന്നത് മികച്ച പ്രോംപ്റ്റുകൾ (prompts) ഉപയോഗിച്ചല്ല. അവ വിശ്വസനീയമായ സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗിലൂടെയാണ് നിർമ്മിക്കപ്പെടുന്നത്. അവയ്ക്ക് വേർഷനിംഗ് (versioning), മോണിറ്ററിംഗ് (monitoring), ഫോളബാക്കുകൾ (fallbacks) എന്നിവ ആവശ്യമാണ്.

അതിരുകൾ നിശ്ചയിക്കുക

ആദ്യം എനിക്ക് പൂർണ്ണമായ സ്വയംഭരണം (autonomy) വേണമായിരുന്നു. എന്നാൽ ഏജന്റ് ഒരു നിർണ്ണായക സർവീസിനെ (critical service) റീസ്റ്റാർട്ട് ചെയ്യാൻ പോയി. ഒരു സ്വയംഭരണ ഏജന്റിനെ നിർമ്മിക്കുക എന്നാൽ അത് എപ്പോൾ പ്രവർത്തിക്കരുത് എന്ന് തീരുമാനിക്കുക എന്നതാണെന്ന് ഞാൻ പഠിച്ചു. അതിരുകൾ നിശ്ചയിക്കുന്നത് നല്ലൊരു എഞ്ചിനീയറിംഗ് രീതിയാണ്.

ഫലം

ഒരു ദിവസം രാവിലെ, എന്റെ ഏജന്റിൽ നിന്നുള്ള ഒരു Telegram സന്ദേശമാണ് ഞാൻ കണ്ടത്. അത് എന്റെ ഇമെയിലുകൾ ഫ്ലാഗ് ചെയ്യുകയും, ലേഖനങ്ങൾ പ്രസിദ്ധീകരിക്കുകയും, എന്റെ സെർവർ RAM പരിശോധിക്കുകയും ചെയ്തിരുന്നു. ഞാൻ ഉറങ്ങുന്ന സമയത്തും അത് ജോലി ചെയ്തുകൊണ്ടിരുന്നു.

നിങ്ങൾക്കുള്ള എന്റെ ഉപദേശം:

ചെറുതായി തുടങ്ങുക. ഒരു ജോലി തിരഞ്ഞെടുത്ത് അത് നന്നായി ചെയ്യുക.
ഓരോന്നായി ടൂളുകൾ ചേർക്കുക.
എറർ ലോഗിംഗ് (error logging), മോണിറ്ററിംഗ് (monitoring) പോലുള്ള വിരസമായ കാര്യങ്ങൾ ഒഴിവാക്കരുത്.
എത്രയും വേഗം പ്രൊഡക്ഷനിൽ (production) പ്രവർത്തിപ്പിക്കുക.

ഈ സിസ്റ്റങ്ങൾ എങ്ങനെയാണ് പ്രവർത്തിക്കുന്നതെന്ന് മനസ്സിലാക്കാൻ ഒരു ഏജന്റിനെ നിർമ്മിക്കുക. യഥാർത്ഥ്യം അറിയാതെ തന്നെ മിക്ക ആളുകളും ഇവയെക്കുറിച്ച് സംസാരിക്കാറുണ്ട്. നിങ്ങൾ ആ മിക്ക ആളുകളിൽ ഒരാളാകരുത്.

സ്രോതസ്സ്: https://dev.to/mkautsar/i-built-my-own-ai-agent-heres-what-nobody-tells-you-3g31

ഓപ്ഷണൽ ലേണിംഗ് കമ്മ്യൂണിറ്റി: https://t.me/GyaanSetuAi

ഞാൻ എന്റെ സ്വന്തം AI ഏജന്റ് നിർമ്മിച്ചു. ആരും നിങ്ങളോട് പറയാത്ത കാര്യങ്ങൾ ഇതാ.

സാങ്കേതികവിദ്യയിലെ വിടവ് (The Gap in Tech)

ടൂളുകളാണ് ഏജന്റിനെ രൂപപ്പെടുത്തുന്നത്

മെമ്മറി പ്രശ്നം

പ്രൊഡക്ഷൻ പ്രയാസകരമാണ്

അതിരുകൾ നിശ്ചയിക്കുക

ഫലം

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗙𝗶𝗿𝘀𝘁 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿 𝗔𝗴𝗲𝗻𝘁

ഒരു AI ആർക്കിടെക്ചർ നിർമ്മിക്കുന്നതിനുള്ള ശരിയായ രീതി

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗔𝘂𝘁𝗼𝗻𝗼𝗺𝗼𝘂𝘀 𝗔𝗴𝗲𝗻𝘁 𝗧𝗲𝗮𝗺

𝗛𝗼𝘄 𝗜 𝗕𝘂𝗶𝗹𝗱 𝗔𝗜 𝗨𝘀𝗮𝗴𝗲 𝗣𝗼𝗹𝗶𝗰𝗶𝗲𝘀 𝗣𝗲𝗼𝗽𝗹𝗲 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗙𝗼𝗹𝗹𝗼𝘄

ഒരു AI ഏജന്റ് യഥാർത്ഥത്തിൽ ആർക്ക് വേണ്ടിയുള്ളതാണ്?