ChatGPT-ൽ നിന്ന് AI ഏജന്റുകളിലേക്ക്: ഒരു എൻജിനീയർ എന്ന നിലയിലുള്ള രണ്ട് വർഷങ്ങൾ

രണ്ട് വർഷം മുമ്പ്, ചോദ്യങ്ങൾ ചോദിക്കാൻ മാത്രമാണ് ഞാൻ AI ഉപയോഗിച്ചിരുന്നത്.

ഇന്ന്, ഞാൻ ഒന്നിലധികം കോഡിംഗ് ഏജന്റുകളെ ഏകോപിപ്പിക്കുന്നു (orchestrate). MCP വഴി കമ്പനിയുടെ അറിവുകളെ ഞാൻ ബന്ധിപ്പിക്കുന്നു. iOS ആപ്പുകളിൽ ലോക്കൽ മോഡലുകൾ പ്രവർത്തിപ്പിക്കുന്നു. ഏജന്റുകൾക്ക് ഒന്നിച്ച് പ്രവർത്തിക്കാൻ കഴിയുന്നതിനായി ഞാൻ ഒരു മെമ്മറി ലെയർ നിലനിർത്തുന്നു.

ഞാൻ ഒരു AI ഗവേഷകനല്ല. പരീക്ഷണങ്ങൾ തുടർന്നുപോയ ഒരു സാധാരണ എൻജിനീയർ മാത്രമാണ് ഞാൻ.

ചാറ്റിൽ നിന്ന് ഏജന്റുകളിലേക്കുള്ള എന്റെ യാത്ര ഇതാ.

സ്റ്റേജ് 1: വിശ്വാസ്യതയിലെ വിടവ് തുടക്കത്തിൽ, AI ഒരു മാജിക് പോലെ തോന്നി. പിന്നീട്, അത് വിശ്വസിക്കാൻ കൊള്ളാത്തതായി തോന്നി. മോഡലുകൾ പലപ്പോഴും തെറ്റായ വിവരങ്ങൾ വളരെ ആത്മവിശ്വാസത്തോടെ അവതരിപ്പിക്കുന്നു. ഞാൻ ഒരു കഠിനമായ പാഠം പഠിച്ചു: കേൾക്കാൻ നല്ലതെന്ന് തോന്നുന്ന ഒരു ഉത്തരം വിശ്വസനീയമായ ഒരു ഫലമല്ല.

സ്റ്റേജ് 2: ഒരു പങ്കാളിയായി AI Cursor പോലുള്ള ടൂളുകൾ എല്ലാം മാറ്റിമറിച്ചു. AI ഒരു പ്രത്യേക ചാറ്റ് വിൻഡോയിൽ നിന്ന് എന്റെ കോഡ് എഡിറ്ററിലേക്ക് മാറി. ഫീഡ്‌ബാക്ക് ലൂപ്പ് വളരെ ചെറുതായി മാറി: • ഒരു ആശയം വിവരിക്കുക. • കോഡ് നിർമ്മിക്കുക. • പ്രവർത്തിപ്പിക്കുക, പരാജയം നിരീക്ഷിക്കുക. • പരിഹാരം ചോദിക്കുക. • ആവർത്തിക്കുക.

ഇത് പ്രോട്ടോടൈപ്പുകൾ നിർമ്മിക്കാനുള്ള ചിലവ് കുറച്ചു. ചെറിയ ആശയങ്ങൾ സെറ്റപ്പ് അല്ലെങ്കിൽ കോൺഫിഗറേഷൻ ഘട്ടങ്ങളിൽ ഇല്ലാതാകുന്നില്ല. അവ യഥാർത്ഥത്തിൽ ലക്ഷ്യസ്ഥാനത്ത് എത്തുന്നു.

കോൺടെക്സ്റ്റ് (Context) ആണ് പ്രധാനം എന്ന് ഞാൻ പഠിച്ചു തുടക്കത്തിൽ, ഏജന്റുകൾ തീരുമാനങ്ങൾ മറന്നുപോവുകയോ ആർക്കിടെക്ചർ തകരാറിലാക്കുകയോ ചെയ്തിരുന്നു. ഞാൻ "prompt engineering"-ൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത് നിർത്തി "context engineering" ആരംഭിച്ചു. എന്റെ ഏജന്റുകൾക്കായി ഞാൻ കർശനമായ നിയമങ്ങൾ എഴുതാൻ തുടങ്ങി: • നിലവിലുള്ള ആർക്കിടെക്ചർ പിന്തുടരുക. • കോഡ് മാറ്റുന്നതിന് മുമ്പ് പ്ലാൻ വിശദീകരിക്കുക. • ചോദിക്കാതെ ഫയലുകൾ ഡിലീറ്റ് ചെയ്യരുത്.

ഞങ്ങൾ വെറുതെ നല്ല വാചകങ്ങൾ എഴുതുകയായിരുന്നില്ല. ഒരു പ്രോബബിലിസ്റ്റിക് സിസ്റ്റത്തിന് (probabilistic system) അനുയോജ്യമായ ഒരു സുസ്ഥിരമായ അന്തരീക്ഷം ഞങ്ങൾ നിർമ്മിക്കുകയായിരുന്നു.

സ്റ്റേജ് 3: ചാറ്റ് വിൻഡോയ്ക്ക് അപ്പുറം ഞാൻ വെബ് ചാറ്റുകളിൽ നിന്ന് APIs ലും ലോക്കൽ മോഡലുകളിലേക്കും മാറി. ഒരു ഡെസ്ക്ടോപ്പിൽ മോഡൽ പ്രവർത്തിപ്പിക്കുന്നത് എളുപ്പമാണ്. എന്നാൽ ഒരു മൊബൈൽ ആപ്പിനുള്ളിൽ ഒരു മോഡൽ എത്തിക്കുന്നത് പ്രയാസകരമാണ്. പെട്ടെന്ന്, എനിക്ക് യഥാർത്ഥ എൻജിനീയറിങ് പ്രശ്നങ്ങൾ പരിഹരിക്കേണ്ടി വന്നു: • മോഡൽ വലുപ്പവും മെമ്മറി ഉപയോഗവും. • സ്റ്റാർട്ടപ്പ് ലേറ്റൻസി (Startup latency). • ഓഫ്‌ലൈൻ എക്സിക്യൂഷനും ഉപകരണങ്ങളുമായുള്ള പൊരുത്തവും (device compatibility).

സ്റ്റേജ് 4: ഏജന്റ് അധിഷ്ഠിത വർക്ക്ഫ്ലോകൾ ശ്രദ്ധ "ഈ ഫങ്ക്ഷൻ എഴുതുക" എന്നതിൽ നിന്ന് "ഈ റിപ്പോസിറ്ററി മനസ്സിലാക്കി ഈ ലക്ഷ്യം പൂർത്തിയാക്കുക" എന്നതിലേക്ക് മാറി. ഞാൻ Model Context Protocol (MCP) ഉപയോഗിക്കാനും തുടങ്ങി. എന്റെ കമ്പനിയുടെ നോളജ് പ്ലാറ്റ്‌ഫോമിനായി ഞാൻ ഒരു MCP ഇന്റഗ്രേഷൻ നിർമ്മിച്ചു. ഏജന്റിന് ഇപ്പോൾ പത്ത് വർഷത്തെ കമ്പനി ഡാറ്റ ലഭ്യമാണ്. വെല്ലുവിളി മോഡലിന്റെ ബുദ്ധിശക്തിയിൽ നിന്ന് സിസ്റ്റം ഡിസൈനിലേക്ക് മാറി.

എന്റെ ഏറ്റവും വലിയ പാഠങ്ങൾ: • കോഡിംഗ് എളുപ്പമാണ്, എന്നാൽ എൻജിനീയറിംഗ് കൂടുതൽ പ്രയാസകരമാണ്. • AI കാര്യങ്ങൾ നടപ്പിലാക്കുന്നു, എന്നാൽ തീരുമാനങ്ങൾ എടുക്കേണ്ടത് നിങ്ങളാണ്. • നിങ്ങൾ ലക്ഷ്യങ്ങൾ കൃത്യമായി നിർവചിക്കുകയും അനുമാനങ്ങൾ പരിശോധിക്കുകയും വേണം. • മൾട്ടി-ഏജന്റ് ജോലികൾക്ക് ഒരു മെമ്മറി ലെയർ ആവശ്യമാണ്, അങ്ങനെ ഏജന്റുകൾക്ക് വീണ്ടും തുടങ്ങാതെ തന്നെ ജോലികൾ കൈമാറാൻ സാധിക്കും.

AI കാര്യങ്ങൾ നടപ്പിലാക്കുന്നത് ലാഭകരമാക്കുന്നു. ഇതിനർത്ഥം പരീക്ഷണങ്ങൾ ഇപ്പോൾ സൗജന്യമാണ് എന്നാണ്. ഏത് ആശയങ്ങളാണ് യഥാർത്ഥത്തിൽ നിർമ്മിക്കാൻ യോഗ്യതയുള്ളതെന്ന് തീരുമാനിക്കുക എന്നതാണ് യഥാർത്ഥ ജോലി.

ഉറവിടം: https://dev.to/timetxt/from-prompting-chatgpt-to-orchestrating-ai-agents-two-years-as-an-ordinary-engineer-1li7

ഓപ്ഷണൽ ലേണിംഗ് കമ്മ്യൂണിറ്റി: https://t.me/GyaanSetuAi