എന്താണ് Loopcraft?

AI ലോകത്തിന് പുതിയൊരു പദം പരിചയപ്പെടുകയാണ്: Loopcraft.

പഴയൊരു ആശയത്തിന് നൽകുന്ന പുതിയൊരു പേരാണിതെന്ന് ചിലർ പറഞ്ഞേക്കാം. ആളുകൾ ഇതിനെ മുൻപ് Agent Loops അല്ലെങ്കിൽ Workflow Engineering എന്നാണ് വിളിച്ചിരുന്നത്. എന്നാൽ സിലിക്കൺ വാലിയിൽ (Silicon Valley) സംഭവിക്കുന്ന മാറ്റം യഥാർത്ഥമാണ്.

Andrej Karpathy, Boris Cherny തുടങ്ങിയ വിദഗ്ധർ മാനുവൽ പ്രോംപ്റ്റിംഗിൽ (manual prompting) നിന്ന് മാറിപ്പോകുകയാണ്. അവർ ഇനി ഏജന്റുകൾക്ക് നേരിട്ട് പ്രോംപ്റ്റുകൾ നൽകുന്നില്ല. പകരം, ഏജന്റുകൾക്ക് പ്രോംപ്റ്റുകൾ നൽകുന്ന ലൂപ്പുകൾ (loops) രൂപകൽപ്പന ചെയ്യുകയാണ് അവർ ചെയ്യുന്നത്.

ഇതിലെ പ്രധാന മാറ്റം അബ്‌സ്‌ട്രാക്ഷനെ (abstraction) കുറിച്ചുള്ളതാണ്.

പഴയ രീതി: മനുഷ്യൻ -> പ്രോംപ്റ്റ് -> ഏജന്റ് -> ഫലം

പുതിയ രീതി: മനുഷ്യൻ -> ലൂപ്പ് രൂപകൽപ്പന ചെയ്യുന്നു -> ടാസ്ക് കണ്ടെത്തുന്നു -> നിർവ്വഹണം -> ഓട്ടോമാറ്റിക് വെരിഫിക്കേഷൻ -> വീണ്ടും ശ്രമിക്കുക -> സ്റ്റേറ്റ് സേവ് ചെയ്യുന്നു -> തുടരുന്നു

പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗ് (Prompt Engineering) ഒരു ഇന്ററാക്ഷനെ മാത്രം മെച്ചപ്പെടുത്തുന്നു. എന്നാൽ Loopcraft ആവർത്തിച്ച് പ്രവർത്തിക്കുന്ന ഒരു മുഴുവൻ സിസ്റ്റത്തെയും മെച്ചപ്പെടുത്തുന്നു.

Loopcraft സിസ്റ്റം സംബന്ധമായ ചോദ്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു:

  • അടുത്ത ടാസ്ക് ആര് തുടങ്ങും?
  • ലക്ഷ്യം ഏജന്റിന് എങ്ങനെ അറിയാൻ സാധിക്കും?
  • ഔട്ട്‌പുട്ട് ആരാണ് പരിശോധിക്കുന്നത്?
  • പരാജയങ്ങൾ എങ്ങനെ ഫീഡ്‌ബാക്ക് ആയി മാറുന്നു?
  • സെഷനുകൾക്കിടയിൽ സ്റ്റേറ്റ് (state) എങ്ങനെ സേവ് ചെയ്യുന്നു?

നിങ്ങൾ ഒരു ഘട്ടം മാത്രം ഓട്ടോമേറ്റ് ചെയ്യുന്നുവെങ്കിൽ, നിങ്ങൾ ഒരു സിസ്റ്റമല്ല നിർമ്മിക്കുന്നത്. പകരം ഒരു മാനുവൽ പ്രക്രിയയുടെ വേഗത കൂട്ടുക മാത്രമാണ് ചെയ്യുന്നത്.

ഒരു യഥാർത്ഥ ലൂപ്പ് അതിന്റെ മുഴുവൻ ജീവിതചക്രംയും (lifecycle) കൈകാര്യം ചെയ്യുന്നു. ഉദാഹരണത്തിന്, ഒരു CI പരാജയം നിങ്ങൾ മാനുവലായി പരിഹരിക്കുന്നതിന് പകരം, ഒരു Loopcraft സിസ്റ്റം:

  • പരാജയം കണ്ടെത്തുന്നു.
  • ലോഗുകൾ (logs) വായിക്കുന്നു.
  • ഒരു ഐസൊലേറ്റഡ് എൻവയോൺമെന്റിൽ (isolated environment) ഒരു ഏജന്റിനെ പ്രവർത്തിപ്പിക്കുന്നു.
  • കോഡ് മാറ്റം വരുത്തുന്നു.
  • ടെസ്റ്റുകൾ നടത്തുന്നു.
  • വ്യത്യാസങ്ങൾ (diff) പരിശോധിക്കാൻ രണ്ടാമതൊരു വെരിഫയറെ ഉപയോഗിക്കുന്നു.
  • വിജയിച്ചാൽ ഒരു PR ക്രിയേറ്റ് ചെയ്യുന്നു.

ഇതാണ് ഒരു Agent Harness-ഉം Loopcraft-ഉം തമ്മിലുള്ള വ്യത്യാസം. ഒരു Harness എന്നത് എൻവയോൺമെന്റ് ആണ്. അത് ടൂളുകൾ, മെമ്മറി, പെർമിഷനുകൾ എന്നിവ നൽകുന്നു. അത് ഉത്തരം നൽകുന്നു: "ഏജന്റ് എങ്ങനെ പ്രവർത്തിക്കുന്നു?" Loopcraft എന്നത് ഓർക്കസ്ട്രേഷൻ (orchestration) ആണ്. അത് ഉത്തരം നൽകുന്നു: "ഏജന്റ് എപ്പോൾ പ്രവർത്തിക്കുന്നു, എന്തുകൊണ്ടാണ് അത് തുടരുന്നത്?"

ഒരു മിനിമൽ ലൂപ്പ് നിർമ്മിക്കാൻ നിങ്ങൾക്ക് ആറ് ഭാഗങ്ങൾ ആവശ്യമാണ്:

  • Trigger: ഒരു CI പരാജയം അല്ലെങ്കിൽ ഷെഡ്യൂൾ ചെയ്ത ജോബ് പോലുള്ള ഒരു ഇവന്റ്.
  • Goal: മെഷീൻ വഴി പരിശോധിക്കാൻ കഴിയുന്ന ഒരു കണ്ടീഷൻ അല്ലെങ്കിൽ ടെസ്റ്റ്.
  • State: പുരോഗതിയും പരാജയ കാരണങ്ങളും സംഭരിച്ചു വെക്കാനുള്ള മാർഗ്ഗം.
  • Worker: ഒരു ഐസൊലേറ്റഡ് കണ്ടെയ്‌നറിൽ പ്രവർത്തിക്കുന്ന ഏജന്റ്.
  • Verifier: ജോലിയുടെ നിലവാരം പരിശോധിക്കാനുള്ള ഒരു ടെസ്റ്റ് അല്ലെങ്കിൽ രണ്ടാമതൊരു LLM.
  • Budget: സമയം, ചിലവ്, വീണ്ടും ശ്രമിക്കാനുള്ള അവസരങ്ങൾ എന്നിവയ്ക്കുള്ള പരിധി.

Loopcraft-ന്റെ ഏറ്റവും ഉയർന്ന തലമാണ് ഇംപ്രൂവ്മെന്റ് ലൂപ്പ് (improvement loop). ഒരു സാധാരണ ലൂപ്പ് ജോലികൾ ആവർത്തിക്കുന്നു. എന്നാൽ ഒരു ഇംപ്രൂവ്മെന്റ് ലൂപ്പ് പരാജയങ്ങൾ വിശകലനം ചെയ്ത് സിസ്റ്റത്തിൽ തന്നെ മാറ്റങ്ങൾ വരുത്തുന്നു. അടുത്ത തവണ കൂടുതൽ മികച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ ഇത് പ്രോംപ്റ്റുകളും ടൂളുകളും ക്രമീകരിക്കുന്നു.

ഓരോ ഫലവും മാനുവലായി പരിഹരിക്കാൻ ശ്രമിക്കുന്നത് നിർത്തുക. ആ ഫലങ്ങൾ ഉണ്ടാക്കുന്ന സിസ്റ്റത്തെ പരിഹരിക്കാൻ തുടങ്ങുക.

Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff

Optional learning community: https://t.me/GyaanSetuAi