The AI Agent Tooling Explosion
AI ഏജന്റുകൾ അതിവേഗം വളരുകയാണ്. ഒരു ആഴ്ച ആളുകൾ ചാറ്റിനെക്കുറിച്ച് സംസാരിക്കുന്നു. അടുത്ത ആഴ്ച നിങ്ങൾ ഉറങ്ങിക്കിടക്കുമ്പോൾ തന്നെ ഫീച്ചറുകൾ തയ്യാറാക്കി നൽകുന്ന ഏജന്റുകളെക്കുറിച്ച് അവർ സംസാരിക്കുന്നു.
അടുത്തിടെ ഒരു പുതിയ പ്ലഗിൻ മൂന്നാഴ്ചയ്ക്കുള്ളിൽ 73,000 GitHub സ്റ്റാറുകൾ നേടി. ഇത് വെറും പ്രചാരണമല്ല. ഇത് നമ്മൾ സോഫ്റ്റ്വെയർ നിർമ്മിക്കുന്ന രീതിയിലുള്ള ഒരു മാറ്റമാണ്.
ഏറ്റവും പ്രചാരമുള്ള ഓപ്പൺ സോഴ്സ് ഏജന്റ് ടൂളുകളെക്കുറിച്ച് ഞാൻ പഠിച്ചു. അഞ്ച് പ്രോജക്റ്റുകൾക്ക് മാത്രം ഏകദേശം 500,000 സ്റ്റാറുകളുണ്ട്. അവ പരസ്പരം മത്സരിക്കുന്നില്ല. മറിച്ച്, ഒരേ പ്രശ്നത്തിന്റെ വ്യത്യസ്ത വശങ്ങൾ അവ പരിഹരിക്കുന്നു.
വിവരങ്ങൾ താഴെ നൽകുന്നു:
• obra/superpowers: 245,614 സ്റ്റാറുകൾ. ഏജന്റ് സ്കില്ലുകൾക്കും മെത്തഡോളജിക്കുമുള്ള ഒരു ഫ്രെയിംവർക്ക്. • thedotmack/claude-mem: 85,713 സ്റ്റാറുകൾ. ഏജന്റുകൾക്കായി പെർസിസ്റ്റന്റ് മെമ്മറി. • bytedance/deer-flow: 76,027 സ്റ്റാറുകൾ. റിസർച്ചും കോഡിംഗും നടത്തുന്നതിനുള്ള ടൂളുകൾ. • DietrichGebert/ponytail: 73,143 സ്റ്റാറുകൾ. ഏജന്റുകളെ സീനിയർ ഡെവലപ്പർമാരെപ്പോലെ ചിന്തിക്കാൻ സഹായിക്കുന്നു. • cobusgreyling/loop-engineering: പുതിയത്. ഒരു എൻജിനീയറിംഗ് ലൂപ്പ് ഫ്രെയിംവർക്ക്.
ഈ ടൂളുകൾ നമുക്ക് അഞ്ച് പാഠങ്ങൾ നൽകുന്നു:
കുറഞ്ഞ കോഡ് എഴുതുക. മിക്ക ടൂളുകളും അളവിനാണ് (volume) പ്രാധാന്യം നൽകുന്നത്. പരമാവധി കോഡ് നിർമ്മിക്കാനാണ് അവ ശ്രമിക്കുന്നത്. എന്നാൽ മികച്ച ടൂളുകൾ മൂല്യത്തിന് (value) പ്രാധാന്യം നൽകുന്നു. Ponytail എന്ന ടൂൾ ഏജന്റുകളെ മടിയന്മാരായ സീനിയർ ഡെവലപ്പർമാരെപ്പോലെ പ്രവർത്തിക്കാൻ പഠിപ്പിക്കുന്നു. ഒരു മാറ്റം വരുത്തുന്നതിന് മുമ്പ് അത് ആവശ്യമാണോ എന്ന് അത് ചോദിക്കുന്നു. നിങ്ങൾ ഒരിക്കലും എഴുതാത്ത കോഡാണ് ഏറ്റവും വേഗതയേറിയ കോഡ്.
ബുദ്ധിയുള്ള മോഡലുകളേക്കാൾ മികച്ചത് ഘടനയാണ് (Structure). ഒരു ഫീച്ചർ നിർമ്മിക്കാൻ ഏജന്റിനോട് വെറുതെ ആവശ്യപ്പെട്ടാൽ മാത്രം പോരാ. നിങ്ങൾക്ക് ഒരു പ്രക്രിയ ആവശ്യമാണ്. വിജയകരമായ ടൂളുകൾ ഒരു ഘടനാപരമായ ലൈഫ് സൈക്കിൾ ഉപയോഗിക്കുന്നു:
- Spec: എന്താണ് നിർമ്മിക്കേണ്ടതെന്ന് നിർവചിക്കുക.
- Plan: ജോലിയെ ഘട്ടങ്ങളായി തിരിക്കുക.
- Implement: ഘട്ടം ഘട്ടമായി കോഡ് എഴുതുക.
- Review: റിവ്യൂ ഓട്ടോമേറ്റ് ചെയ്യുക.
- Refactor: കണ്ടെത്തിയ കാര്യങ്ങൾ അടിസ്ഥാനമാക്കി മെച്ചപ്പെടുത്തുക.
ഏജന്റുകൾക്ക് ഓർമ്മശക്തി ആവശ്യമാണ്. സാധാരണ ഏജന്റുകൾ അഞ്ച് മിനിറ്റ് മുമ്പ് ചെയ്ത കാര്യങ്ങൾ മറന്നുപോകുന്നു. Claude-mem പോലുള്ള ടൂളുകൾ ഏജന്റുകൾക്ക് ഒരു തലച്ചോറ് നൽകുന്നു. അവ വ്യത്യസ്ത സെഷനുകളിലുടനീളം പ്രോജക്റ്റ് പാറ്റേണുകളും തീരുമാനങ്ങളും സൂക്ഷിച്ചുവെക്കുന്നു. ഇത് ഒരേ കാര്യങ്ങൾ വീണ്ടും ആവർത്തിക്കുന്നത് ഒഴിവാക്കുന്നു.
മിഡിൽ ലെയറുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുക. ഏത് ഏജന്റ് ഉപയോഗിക്കണം എന്ന് മാത്രം ചോദിക്കരുത്. യഥാർത്ഥ മൂല്യം സ്റ്റാക്കിന്റെ മധ്യഭാഗത്താണ് നിലനിൽക്കുന്നത്:
- Skills: ഏജന്റ് എങ്ങനെ പെരുമാറുന്നു.
- Memory: അത് എങ്ങനെ ഓർമ്മിക്കുന്നു.
- Orchestration: അത് ജോലികൾ എങ്ങനെ നിയന്ത്രിക്കുന്നു.
- സുരക്ഷ ഒരു വലിയ അപകടസാധ്യതയാണ്. പല ഏജന്റുകളും അവയുടെ സിസ്റ്റം പ്രോംപ്റ്റുകൾ ചോർത്തപ്പെടുന്നു (leak). നിങ്ങളുടെ ഏജന്റിന് കോഡിലേക്കോ ക്രെഡൻഷ്യലുകളിലേക്കോ പ്രവേശനം ഉണ്ടെങ്കിൽ ഇത് അപകടകരമാണ്. സാൻഡ്ബോക്സ്ഡ് എൻവയോൺമെന്റുകൾ (sandboxed environments) ഉപയോഗിക്കുക, ഏജന്റുകൾക്ക് ആവശ്യമായ ഏറ്റവും കുറഞ്ഞ പ്രവേശനം മാത്രം നൽകുക.
ഭാവി എന്നത് ഒരു സൂപ്പർ ഏജന്റ് മാത്രമല്ല. ഭാവി എന്നത് ഒന്നിച്ച് പ്രവർത്തിക്കുന്ന ടൂളുകളുടെ ഒരു സ്റ്റാക്ക് ആണ്.
Optional learning community: https://t.me/GyaanSetuAi
