The Anatomy of an Agent Harness

Translated for your language. Read the original.

AI-assisted draft.

ഒരു ഏജന്റ് ഹാർനസിന്റെ ഘടന

നിങ്ങൾ ഒരു ചാറ്റ്‌ബോട്ട് നിർമ്മിച്ചു. കുറച്ച് ടൂളുകളും ഒരു ലളിതമായ ലൂപ്പും നിങ്ങൾ അതിൽ ചേർത്തു. ഒരു ഡെമോയ്ക്ക് ഇത് പ്രവർത്തിക്കും. എന്നാൽ നിങ്ങൾ ഇത് പ്രൊഡക്ഷനിലേക്ക് മാറ്റാൻ ശ്രമിക്കുമ്പോൾ എല്ലാം തകരാറിലാകുന്നു.

മോഡൽ മുൻപത്തെ ഘട്ടങ്ങൾ മറന്നുപോകുന്നു. മുന്നറിയിപ്പില്ലാതെ ടൂൾ കോളുകൾ പരാജയപ്പെടുന്നു. കോൺടെക്സ്റ്റ് വിൻഡോ ഉപയോഗശൂന്യമായ ഡാറ്റ കൊണ്ട് നിറയുന്നു.

പ്രശ്നം നിങ്ങളുടെ മോഡലല്ല. പ്രശ്നം അതിന് ചുറ്റുമുള്ള ഇൻഫ്രാസ്ട്രക്ചറാണ്.

ഈ ഇൻഫ്രാസ്ട്രക്ചറിനെയാണ് ഏജന്റ് ഹാർനസ് (agent harness) എന്ന് വിളിക്കുന്നത്.

ഏജന്റ് എന്നത് പെരുമാറ്റമാണ് (behavior). ഹാർനസ് എന്നത് അതിന്റെ യന്ത്രസംവിധാനമാണ് (machinery). നിങ്ങൾ മോഡലല്ലെങ്കിൽ, നിങ്ങൾ ഹാർനസാണ്.

ഒരു റോ LLM-നെ ഒരു CPU ആയി കരുതുക. അതിന് RAM-ഓ, ഡിസ്കോ, അല്ലെങ്കിൽ I/O-യോ ഇല്ല. ഹാർനസ് എന്നത് ഒരു ഓപ്പറേറ്റിംഗ് സിസ്റ്റമാണ്. മോഡലിനെ ഉപയോഗപ്രദമാക്കാൻ ആവശ്യമായ മെമ്മറി, ടൂളുകൾ, ലോജിക് എന്നിവ അത് നൽകുന്നു.

പ്രൊഡക്ഷൻ-ഗ്രേഡ് ഹാർനസിന് പന്ത്രണ്ട് പ്രധാന ഘടകങ്ങളുണ്ട്:

• Orchestration Loop: ഇതാണ് ഹൃദയമിടിപ്പ്. ഇത് Thought-Action-Observation സൈക്കിൾ നിയന്ത്രിക്കുന്നു. • Tool Layer: ഇവ കൈകളാണ്. ടൂൾ രജിസ്ട്രേഷൻ, വാലിഡേഷൻ, എക്സിക്യൂഷൻ എന്നിവ ഹാർനസ് കൈകാര്യം ചെയ്യുന്നു. • Memory: ഇതിൽ ഷോർട്ട്-ടേം ഹിസ്റ്ററിയും സെഷനുകൾക്കിടയിലുള്ള ലോംഗ്-ടേം പെർസിസ്റ്റൻസും ഉൾപ്പെടുന്നു. • Context Management: ഡാറ്റ കംപാക്ട് ചെയ്യുകയോ സംഗ്രഹിക്കുകയോ ചെയ്തുകൊണ്ട് ഇത് കോൺടെക്സ്റ്റ് നശിക്കുന്നത് (context rot) തടയുന്നു. • Prompt Assembly: ഓരോ ഘട്ടത്തിലും മോഡൽ കാണുന്ന കൃത്യമായ ഇൻപുട്ട് ഇത് നിർമ്മിക്കുന്നു. • Output Classification: മോഡലിന് സംസാരിക്കണോ അതോ ഒരു ടൂൾ ഉപയോഗിക്കണോ എന്ന് ഇത് തീരുമാനിക്കുന്നു. • State Management: ഒരു പിശക് അല്ലെങ്കിൽ തടസ്സം ഉണ്ടാകുമ്പോൾ ജോലി പുനരാരംഭിക്കാൻ ഇത് ഏജന്റിനെ അനുവദിക്കുന്നു. • Error Handling: പിശകുകൾ വർദ്ധിച്ചു പോകാതിരിക്കാൻ ഇത് പരാജയങ്ങളെ തടയുന്നു. • Guardrails: സുരക്ഷിതമല്ലാത്തതോ തെറ്റായതോ ആയ പ്രവർത്തനങ്ങൾ തടയാൻ ഇവ ട്രിപ്പ്വയറുകളായി പ്രവർത്തിക്കുന്നു. • Permission Enforcement: മോഡൽ ചെയ്യാൻ ആഗ്രഹിക്കുന്ന കാര്യങ്ങളിൽ നിന്നും അതിന് അനുവാദമുള്ള കാര്യങ്ങളിൽ നിന്നും ഇത് വ്യത്യാസം വരുത്തുന്നു. • Verification Loops: ഗുണനിലവാരം മെച്ചപ്പെടുത്തുന്നതിനായി സ്വന്തം ജോലി പരിശോധിക്കാൻ ഇത് മോഡലിനെ അനുവദിക്കുന്നു. • Agent Handoffs: ഒരു ഏജന്റ് എങ്ങനെ മറ്റൊരു ഏജന്റിന് ജോലി കൈമാറുന്നു എന്ന് ഇത് നിയന്ത്രിക്കുന്നു.

ഹാർനസ് പരമാവധി ലളിതമായി നിലനിർത്തുക എന്നതാണ് നല്ല എഞ്ചിനീയറിംഗിന്റെ ലക്ഷ്യം. മോഡലുകൾ കൂടുതൽ ബുദ്ധിമാതാക്കളാകുമ്പോൾ, നിങ്ങൾക്ക് കുറഞ്ഞ സ്കാഫോൾഡിംഗ് (scaffolding) മതിയാകും.

നിങ്ങളുടെ ഏജന്റ് പരാജയപ്പെടുമ്പോൾ, മോഡലിനെ കുറ്റപ്പെടുത്തരുത്. നിങ്ങളുടെ ഹാർനസ് പരിശോധിക്കുക.

Source: https://dev.to/aniruddhaadak/the-anatomy-of-an-agent-harness-1n1j

Optional learning community: https://t.me/GyaanSetuAi

The Anatomy of an Agent Harness

Continue reading

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗜𝘀 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁. 𝗛𝗲𝗿𝗲'𝘀 𝗪𝗵𝗮𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗜𝘀.

𝗧𝗵𝗲 𝗩𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗧𝗲𝘀𝘁 𝗘𝘃𝗲𝗿𝘆 𝗔𝗜 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗙𝗮𝗶𝗹𝘀

നിങ്ങളുടെ മോഡൽ ഫൈൻ ട്യൂൺ ചെയ്യുന്നത് നിർത്തൂ. പ്രശ്നം നിങ്ങളുടെ ആർക്കിടെക്ചറിലാണ്.

Inside An AI Agent