ഒരു AI ഏജന്റ് യഥാർത്ഥത്തിൽ ആർക്ക് വേണ്ടിയുള്ളതാണ്?

📅3 hours ago⏱2 min read

In this article

ഒരു AI ഏജന്റ് യഥാർത്ഥത്തിൽ ആർക്ക് വേണ്ടിയാണ്?

"AI ഏജന്റ്" എന്ന പദം ഓരോരുത്തർക്കും വ്യത്യസ്തമായ അർത്ഥങ്ങളാണ് നൽകുന്നത്. ഒരു ഏജന്റുമായുള്ള നിങ്ങളുടെ ബന്ധം നിങ്ങളുടെ പങ്കിനെ (role) ആശ്രയിച്ചിരിക്കും. ഈ പങ്കുകൾ തമ്മിലുള്ള വിടവ് ബിസിനസ്സിൽ വലിയ പ്രശ്നങ്ങൾക്ക് കാരണമാകുന്നു.

തെറ്റായ ആളുകൾക്കായി ഉൽപ്പന്നങ്ങൾ നിർമ്മിക്കപ്പെടുന്നു. എഞ്ചിനീയർമാർക്ക് നിറവേറ്റാൻ കഴിയാത്ത പ്രതീക്ഷകൾ ബോർഡ്റൂമുകൾ നിശ്ചയിക്കുന്നു. ഉപയോക്താക്കൾക്ക് അവർക്ക് മനസ്സിലാകാത്ത ടൂളുകൾ ലഭിക്കുന്നു.

വിവിധ പങ്കുകൾ AI ഏജന്റുകളെ എങ്ങനെ കാണുന്നു എന്ന് താഴെ നൽകുന്നു:

സാധാരണ ഉപയോക്താവ് (The Everyday User) അവർ ഒരു ലൈറ്റ് സ്വിച്ച് പോലെ പ്രവർത്തിക്കുന്ന ടൂളാണ് ആഗ്രഹിക്കുന്നത്. മോഡലുകളെക്കുറിച്ചോ മെമ്മറിയെക്കുറിച്ചോ അവർക്ക് ആശങ്കയില്ല. ആദ്യ ശ്രമത്തിൽ തന്നെ ജോലി പൂർത്തിയാകുന്നുണ്ടോ എന്ന് മാത്രമാണ് അവർ ശ്രദ്ധിക്കുന്നത്. തങ്ങൾ ആവശ്യപ്പെടാത്ത എന്തെങ്കിലും ഏജന്റ് ചെയ്യുന്നത് ആണ് അവരുടെ പ്രധാന പേടി.
പരീക്ഷണങ്ങൾ നടത്തുന്നവർ (The Tinkerer) അവർ കസ്റ്റം പ്രോംപ്റ്റുകളും (custom prompts) ഓട്ടോമേഷൻ ടൂളുകളും ഉപയോഗിക്കുന്നു. നിയന്ത്രിത സാഹചര്യങ്ങളിൽ (controlled environment) കൃത്യമായി പ്രവർത്തിക്കുന്ന സിസ്റ്റങ്ങൾ അവർ നിർമ്മിക്കുന്നു. ഏജന്റുകൾ ആത്മവിശ്വാസത്തോടെ തെറ്റായ ഉത്തരങ്ങൾ നൽകുകയോ അല്ലെങ്കിൽ ഒരു API മാറ്റം അവരുടെ പ്രവർത്തനരീതിയെ (workflow) തടസ്സപ്പെടുത്തുകയോ ചെയ്യുമ്പോൾ അവർ ബുദ്ധിമുട്ടുന്നു.
എക്സിക്യൂട്ടീവ് (The Executive) വേഗത്തിലുള്ള ജോലി അല്ലെങ്കിൽ കുറഞ്ഞ ചിലവ് എന്നിങ്ങനെ ഏജന്റുകൾ നൽകുന്ന നേട്ടങ്ങളിലാണ് അവർ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. സാങ്കേതികവിദ്യ യഥാർത്ഥത്തിൽ പ്രവർത്തിക്കുന്നുണ്ടോ എന്ന് അറിയുന്നതിന് മുമ്പ് തന്നെ അവർ പലപ്പോഴും നിക്ഷേപകർക്ക് വാഗ്ദാനങ്ങൾ നൽകുന്നു. ഇത് താഴെയുള്ള എല്ലാ സാങ്കേതിക ടീമുകളിലും സമ്മർദ്ദം സൃഷ്ടിക്കുന്നു.
QA എഞ്ചിനീയർ (The QA Engineer) അവർക്ക് കൃത്യമായ പുനരാവർത്തനക്ഷമതയും (reproducibility) "ശരി" എന്നതിനെക്കുറിച്ചുള്ള വ്യക്തമായ നിർവചനങ്ങളും ആവശ്യമാണ്. ഏജന്റുകൾ ഇത് പ്രയാസകരമാക്കുന്നു. ഔട്ട്‌പുട്ട് ഓരോ തവണയും മാറിക്കൊണ്ടിരിക്കുന്നു, കൂടാതെ പരാജയങ്ങൾ പലപ്പോഴും പരമ്പരാഗത പരിശോധനകളിലൂടെ (traditional tests) കണ്ടെത്താൻ കഴിയാത്തവിധം സൂക്ഷ്മമാണ്.
ഐടി ടീം (The IT Team) ഡെപ്ലോയ്‌മെന്റിന്റെ (deployment) ഉത്തരവാദിത്തം അവർ ഏറ്റെടുക്കുന്നു. വ്യക്തമായ എറർ കോഡില്ലാതെ തന്നെ മോഡൽ മോശമായി പ്രവർത്തിക്കുന്ന "stochastic degradation" പോലുള്ള പ്രശ്നങ്ങൾ അവർ നേരിടുന്നു. നിലവിൽ ലഭ്യമല്ലാത്ത ഡോക്യുമെന്റേഷൻ അവർക്ക് ആവശ്യമാണ്.
DBA (The DBA) ഏജന്റിലേക്ക് നൽകുന്ന ഡാറ്റ അവർ നിയന്ത്രിക്കുന്നു. വെക്റ്റർ സ്റ്റോറുകൾ (vector stores) കൈകാര്യം ചെയ്യുന്നതും റിട്രീവൽ ഇൻഡക്സ് (retrieval index) എത്രത്തോളം പഴയതാണെന്ന് ട്രാക്ക് ചെയ്യുന്നതും പോലുള്ള പുതിയ പ്രശ്നങ്ങൾ അവർ നേരിടുന്നു. മറ്റാരേക്കാളും മുമ്പ് ഡാറ്റയിലെ പിശകുകൾ കണ്ടെത്തുന്നത് ഇവരാണ്.
ഡെവലപ്പർ (The Developer) അവർ പകുതി എഞ്ചിനീയറും പകുതി പ്രോംപ്റ്റ് എഴുത്തുകാരും (prompt author) ആയിരിക്കണം. ഡീബഗ്ഗിംഗ് (debugging) ആണ് ഏറ്റവും പ്രയാസകരമായ ഭാഗം. മോശം മോഡൽ റെസ്‌പോൺസിനായി ഒരു സ്റ്റാക്ക് ട്രാസ് (stack trace) ലഭ്യമല്ല. ഒരു പ്രശ്നത്തിനുള്ള പരിഹാരം മൂന്ന് പുതിയ പ്രശ്നങ്ങൾ സൃഷ്ടിച്ചേക്കാം.
ആർക്കിടെക്റ്റ് (The Architect) അവർ ഏജന്റിനെ അതിരുകളും ആശ്രിതത്വങ്ങളും (boundaries and dependencies) ഉള്ള ഒരു സിസ്റ്റമായി കാണുന്നു. സിസ്റ്റം പൂർണ്ണമായും പരാജയപ്പെടാതിരിക്കാൻ ഘടകങ്ങൾ (components) എങ്ങനെ പരസ്പരം ആശയവിനിമയം നടത്തണമെന്ന് അവർ തീരുമാനിക്കണം.

സാങ്കേതികവിദ്യയല്ല പ്രധാന പ്രശ്നം. ഈ ആളുകൾ തമ്മിലുള്ള വിടവാണ് പ്രശ്നം. എല്ലാവരും ഒരേ ടൂൾ ആണ് ഉപയോഗിക്കുന്നത്, എന്നാൽ അത് എന്താണ് ചെയ്യേണ്ടതെന്നോ അല്ലെങ്കിൽ അത് പരാജയപ്പെടുമ്പോൾ അതിന്റെ ഉത്തരവാദിത്തം ആർക്കാണെന്നോ അവർ പരസ്പരം സംസാരിക്കുന്നില്ല.

യഥാർത്ഥത്തിൽ ഒരു AI ഏജന്റ് എന്നാൽ ആരാണ്? ഉപയോക്താക്കളുടെ തരം അനുസരിച്ചുള്ള ഒരു ഗൈഡ്

പലപ്പോഴും ആളുകൾ LLM-കളെയും (Large Language Models) AI ഏജൻ്റുകളെയും തമ്മിൽ മാറിപ്പോകാറുണ്ട്. എന്നാൽ ഇവ രണ്ടും തമ്മിൽ വലിയ വ്യത്യാസമുണ്ട്. ലളിതമായി പറഞ്ഞാൽ, ഒരു LLM എന്നത് ഒരു 'തലച്ചോറ്' പോലെയാണ്; എന്നാൽ ഒരു AI ഏജന്റ് എന്നത് ആ തലച്ചോറും അതിനോടൊപ്പം പ്രവർത്തിക്കാനുള്ള കൈകളും ടൂളുകളും ചേർന്ന ഒന്നാണ്.

എന്താണ് ഒരു AI ഏജൻ്റിനെ നിർമ്മിക്കുന്നത്?

ഒരു സിസ്റ്റത്തെ വെറുമൊരു ചാറ്റ്ബോട്ടിന് പകരം ഒരു ഏജൻ്റായി മാറ്റുന്നത് പ്രധാനമായും നാല് ഘടകങ്ങളാണ്:

യുക്തിചിന്ത (Reasoning): ലഭിക്കുന്ന വിവരങ്ങൾ വിശകലനം ചെയ്യാനും അടുത്ത ഘട്ടം എന്താണെന്ന് തീരുമാനിക്കാനുമുള്ള കഴിവ്.
ആസൂത്രണം (Planning): ഒരു വലിയ ലക്ഷ്യത്തെ ചെറിയ, കൈകാര്യം ചെയ്യാവുന്ന ഘട്ടങ്ങളായി തിരിക്കാനുള്ള കഴിവ്.
ഓർമ്മശക്തി (Memory): മുൻപത്തെ സംഭാഷണങ്ങളും പ്രവർത്തികളും ഓർത്തുവെക്കാനുള്ള കഴിവ് (Short-term and Long-term memory).
ടൂൾ ഉപയോഗം (Tool Use): ഇന്റർനെറ്റിൽ തിരയാനോ, കോഡ് പ്രവർത്തിപ്പിക്കാനോ, മറ്റ് സോഫ്റ്റ്‌വെയറുകൾ ഉപയോഗിക്കാനോ ഉള്ള കഴിവ്.

ഉപയോക്താക്കളുടെ തരം (User Types)

നിങ്ങൾ ഒരു AI ഏജൻ്റിനെ എങ്ങനെ ഉപയോഗിക്കുന്നു എന്നതിനെ അടിസ്ഥാനമാക്കി ഉപയോക്താക്കളെ നാലായി തിരിക്കാം:

1. എക്സ്‌പ്ലോറർ (The Explorer)

ഇവർ പുതിയ കാര്യങ്ങൾ അറിയാനും ചോദ്യങ്ങൾക്ക് ഉത്തരം കണ്ടെത്താനും ഏജൻ്റുകളെ ഉപയോഗിക്കുന്നു. ഇവർക്ക് സങ്കീർണ്ണമായ നിർദ്ദേശങ്ങൾ നൽകുന്നതിനേക്കാൾ, ലളിതമായ സംഭാഷണങ്ങളിലൂടെ വിവരങ്ങൾ നേടാനാണ് താൽപ്പര്യം.

2. ബിൽഡർ (The Builder)

ഇവർ ഏജൻ്റുകളെ ഉപയോഗിച്ച് പുതിയ കാര്യങ്ങൾ നിർമ്മിക്കുന്നു. ഒരു പ്രത്യേക ജോലിക്കായി (ഉദാഹരണത്തിന്: ഒരു ഇമെയിൽ എഴുതുകയോ ഡാറ്റ വിശകലനം ചെയ്യുകയോ ചെയ്യുക) ഏജൻ്റിനെ എങ്ങനെ ക്രമീകരിക്കാം എന്ന് ഇവർ ചിന്തിക്കുന്നു.

3. ഇൻ്റഗ്രേറ്റർ (The Integrator)

ഇവർ ഏജൻ്റുകളെ നിലവിലുള്ള സിസ്റ്റങ്ങളുമായി ബന്ധിപ്പിക്കുന്നു. ഒരു കമ്പനിയുടെ ഡാറ്റാബേസുമായി അല്ലെങ്കിൽ മറ്റ് ആപ്പുകളുമായി ഏജൻ്റിനെ എങ്ങനെ സംയോജിപ്പിക്കാം എന്നതാണ് ഇവരുടെ ശ്രദ്ധാകേന്ദ്രം.

4. ഓർക്കസ്ട്രേറ്റർ (The Orchestrator)

ഇവർ ഒന്നിലധികം ഏജൻ്റുകളെ ഒന്നിച്ച് പ്രവർത്തിപ്പിക്കുന്നു. ഓരോ ഏജൻ്റും ഓരോ പ്രത്യേക ജോലി ചെയ്യുന്നുവെങ്കിൽ, അവയെ ഏകോപിപ്പിച്ച് ഒരു വലിയ ലക്ഷ്യം പൂർത്തിയാക്കുന്നത് ഇവർ ആണ്.

Source: https://dev.to/scythe2/who-is-an-ai-agent-actually-for-a-user-type-field-guide-5760

Optional learning community: https://t.me/GyaanSetuAi

ഒരു AI ഏജന്റ് യഥാർത്ഥത്തിൽ ആർക്ക് വേണ്ടിയുള്ളതാണ്?

യഥാർത്ഥത്തിൽ ഒരു AI ഏജന്റ് എന്നാൽ ആരാണ്? ഉപയോക്താക്കളുടെ തരം അനുസരിച്ചുള്ള ഒരു ഗൈഡ്

എന്താണ് ഒരു AI ഏജൻ്റിനെ നിർമ്മിക്കുന്നത്?

ഉപയോക്താക്കളുടെ തരം (User Types)

1. എക്സ്‌പ്ലോറർ (The Explorer)

2. ബിൽഡർ (The Builder)

3. ഇൻ്റഗ്രേറ്റർ (The Integrator)

4. ഓർക്കസ്ട്രേറ്റർ (The Orchestrator)

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗖𝗵𝗮𝗻𝗴𝗲 𝗦𝗼𝗳𝘁𝘄𝗮𝗿𝗲 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗺𝗲𝗻𝘁

𝟭𝟯 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗥𝗲𝗽𝗼𝗿𝘁 𝘁𝗼 𝗠𝗲. 𝗧𝗵𝗲𝘆 𝗟𝗶𝘃𝗲 𝗪𝗶𝘁𝗵 𝗠𝗲.

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗜𝗻 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗦𝗼𝗳𝘁𝘄𝗮𝗿𝗲

𝗧𝗵𝗲 𝗕𝗶𝗴𝗴𝗲𝘀𝘁 𝗟𝗶𝗲 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀 𝗔𝗿𝗲 𝗕𝗲𝗶𝗻𝗴 𝗧𝗼𝗹𝗱 𝗔𝗯𝗼𝘂𝘁 𝗔𝗜