ഏറ്റവും കൂടുതൽ ചർച്ച ചെയ്യപ്പെടുന്ന AI ഫ്രെയിംവർക്കിന് ഒരു മാരകമായ പോരായ്മയുണ്ട്

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialകഴിഞ്ഞ ആഴ്‌ച2min read

ഏറ്റവും കൂടുതൽ ചർച്ച ചെയ്യപ്പെടുന്ന AI ഫ്രെയിംവർക്കിന് ഒരു മാരകമായ പോരായ്മയുണ്ട്

ഏറ്റവും പ്രചാരമുള്ള AI ഫ്രെയിംവർക്കിന് ഒരു ഗുരുതരമായ പോരായ്മയുണ്ട്

ആളുകൾ എല്ലാറ്റിനെയും ഒരു ഏജന്റ് എന്ന് വിളിക്കുന്നു.

ഒരു ലൂപ്പ് ഉള്ള സ്ക്രിപ്റ്റ് ഒരു ഏജന്റാണ്. മെമ്മറിയുള്ള ഒരു ചാറ്റ്ബോട്ട് ഒരു ഏജന്റാണ്. ഈ തെറ്റ് മോശം എൻജിനീയറിംഗിലേക്ക് നയിക്കുന്നു.

ലളിതമായ ജോലികൾക്കായി സങ്കീർണ്ണമായ ഓർക്കസ്ട്രേഷൻ (orchestration) നിർമ്മിക്കാൻ ടീമുകൾ ആഴ്ചകൾ പാഴാക്കുന്നു. ഒരു സിംഗിൾ പ്രോംപ്റ്റിന് നിങ്ങൾക്ക് ഒരു ഏജന്റിന്റെ ആവശ്യമില്ല.

ഒരു ഏജന്റിന് ഒരു ലക്ഷ്യം ഉണ്ടായിരിക്കണം. അത് അതിന്റെ അടുത്ത ഘട്ടങ്ങൾ സ്വയം തീരുമാനിക്കണം. പരാജയങ്ങൾ കൈകാര്യം ചെയ്യാനും ഒരു ജോലി എപ്പോൾ അവസാനിച്ചു എന്ന് തിരിച്ചറിയാനും അതിന് കഴിയണം.

നിങ്ങളുടെ സിസ്റ്റം പരിശോധിക്കാൻ ഈ നിയമങ്ങൾ ഉപയോഗിക്കുക:

ഓരോ ഘട്ടത്തിലും ഒരു മനുഷ്യൻ മാർഗ്ഗനിർദ്ദേശം നൽകണമെങ്കിൽ, അത് ഒരു ചാറ്റ് ഇന്റർഫേസ് ആണ്.
ഒരു ടൂൾ കോൾ പരാജയപ്പെട്ടാൽ നിങ്ങളുടെ സിസ്റ്റം അതിൽ നിന്ന് തിരിച്ചുവരുന്നുണ്ടെങ്കിൽ, നിങ്ങൾക്കൊരു ഏജന്റ് ഉണ്ട്.
നിങ്ങളുടെ സിസ്റ്റം ഒരു ലക്ഷ്യത്തെ ഉപദൗത്യങ്ങളായി (subtasks) വിഭജിക്കുന്നുണ്ടെങ്കിൽ, നിങ്ങൾക്കൊരു യഥാർത്ഥ ഏജന്റ് ഉണ്ട്.

മിക്ക വിജയകരമായ ഏജന്റുകളും പരിമിതമായ മേഖലകളിൽ മാത്രം പ്രവർത്തിക്കുന്നവയാണ്. അവ ഡോക്യുമെന്റ് എക്സ്ട്രാക്ഷൻ അല്ലെങ്കിൽ കോഡ് റിവ്യൂ പോലുള്ള ഒരു ജോലി മാത്രം ചെയ്യുന്നു. അവ പൊതുവായ റീസണിംഗ് എൻജിനുകൾ (reasoning engines) അല്ല.

മികച്ച ടീമുകൾ മൂന്ന് കാര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു:

ടൂൾ ഡിസൈൻ: ഏജന്റിന് വേണ്ടി ക്ലീൻ ആയ ഇന്റർഫേസുകൾ നിർമ്മിക്കുക.
ഫെയിലിയർ ഹാൻഡ്‌ലിംഗ്: ഒരു ടൂൾ പരാജയപ്പെടുമ്പോൾ എന്ത് സംഭവിക്കണമെന്ന് തീരുമാനിക്കുക.
ഒബ്സർവബിലിറ്റി (Observability): ഒരു ഏജന്റ് എന്തുകൊണ്ട് ഒരു തീരുമാനം എടുത്തു എന്ന് കണ്ടെത്തുക.

LangChain അല്ലെങ്കിൽ CrewAI പോലുള്ള ഫ്രെയിംവർക്കുകളേക്കാൾ പാറ്റേണുകൾക്കാണ് പ്രാധാന്യം. ഞാൻ ഒരേ ആർക്കിടെക്ചർ മൂന്ന് വ്യത്യസ്ത ഫ്രെയിംവർക്കുകളിൽ വീണ്ടും നിർമ്മിച്ചിട്ടുണ്ട്. ഫലങ്ങൾ ഒന്നുതന്നെയായിരുന്നു.

ഈ പാറ്റേണുകൾ പിന്തുടരുക:

പ്ലാൻ ചെയ്യുക, തുടർന്ന് പ്രവർത്തിക്കുക: പ്ലാനിംഗിനായി ഒരു ഘട്ടവും ജോലിക്കായി മറ്റൊരു ഘട്ടവും ഉപയോഗിക്കുക.
റിട്രീവലിനെ റീസണിംഗിൽ നിന്ന് വേർതിരിക്കുക: ഡാറ്റ ശേഖരിക്കുന്നത് അത് ഉപയോഗിക്കുന്നതിന് തുല്യമല്ല.
എക്സ്പ്ലിസിറ്റ് ഹാൻഡ്‌ഓഫുകൾ: ഒരു ഏജന്റ് മറ്റൊരു ഏജന്റിന് ജോലി കൈമാറുമ്പോൾ സ്ട്രക്ചേർഡ് ലോഗുകൾ ഉപയോഗിക്കുക.

മോശം ചങ്കിംഗ് (chunking) കാരണം RAG സിസ്റ്റങ്ങൾ പലപ്പോഴും പരാജയപ്പെടുന്നു. നിങ്ങളുടെ മോഡൽ സാങ്കേതിക വസ്തുതകൾ ശരിയായി പറയുകയും എന്നാൽ സന്ദർഭം (context) വിട്ടുപോവുകയും ചെയ്യുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചങ്കുകളാണ് പ്രശ്നം. സെമാന്റിക് ചങ്കിംഗ് (semantic chunking) അല്ലെങ്കിൽ പാരന്റ്-ഡോക്യുമെന്റ് റിട്രീവൽ (parent-document retrieval) പരീക്ഷിച്ചു നോക്കുക.

ബെഞ്ച്മാർക്കുകൾക്ക് പിന്നാലെ പോകുന്നത് നിർത്തുക. നിങ്ങൾ ശ്രദ്ധിക്കാത്ത സമയത്തും വിശ്വസിക്കാൻ കഴിയുന്ന സിസ്റ്റങ്ങൾ നിർമ്മിക്കുക എന്നതാണ് യഥാർത്ഥ വെല്ലുവിളി.

ഗവേണൻസ്, ഒബ്സർവബിലിറ്റി, വിശ്വസനീയമായ ടൂൾ ഉപയോഗം എന്നിവയിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുക. മികച്ച എൻജിനീയർമാർ പ്രോംപ്റ്റ് എൻജിനീയറിംഗിൽ മാത്രമല്ല, സിസ്റ്റം ഡിസൈനിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കും.

Source: https://dev.to/aibughunter/the-hottest-ai-framework-right-now-has-a-fatal-flaw-nobody-mentions-2ing

Optional learning community: https://t.me/GyaanSetuAi

ഏറ്റവും കൂടുതൽ ചർച്ച ചെയ്യപ്പെടുന്ന AI ഫ്രെയിംവർക്കിന് ഒരു മാരകമായ പോരായ്മയുണ്ട്

Continue reading

𝗧𝗵𝗲 𝗛𝗼𝘁𝘁𝗲𝘀𝘁 𝗔𝗜 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸 𝗥𝗶𝗴𝗵𝘁 𝗡𝗼𝘄 𝗛𝗮𝘀 𝗮 𝗙𝗮𝘁𝗮𝗹 𝗙𝗹𝗮𝘄

പ്രൊഡക്ഷനിൽ AI ഏജന്റുകൾ പ്രവർത്തിപ്പിക്കുമ്പോൾ ഞാൻ പഠിച്ച കാര്യങ്ങൾ

പ്രൊഡക്ഷൻ AI ഏജന്റുകൾ നിർമ്മിക്കാൻ ഞാൻ ഉപയോഗിക്കുന്ന കൃത്യമായ സ്റ്റാക്ക്

നിങ്ങളുടെ മോഡൽ ഫൈൻ ട്യൂൺ ചെയ്യുന്നത് നിർത്തൂ. പ്രശ്നം നിങ്ങളുടെ ആർക്കിടെക്ചറിലാണ്.

The Window to Build AI Expertise Is Closing