𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅
നിങ്ങളുടെ AI ഏജന്റ് നിങ്ങൾ വിചാരിക്കുന്നതിനേക്കാൾ കൂടുതൽ ചിലവ് വരുത്തുന്ന ഒന്നാണ്.
ഒരു ഏജന്റ് ഓരോ തവണയും ഒരു MCP ടൂൾ ഉപയോഗിക്കുമ്പോഴും, നിങ്ങൾ വലിയൊരു മറഞ്ഞിരിക്കുന്ന ചിലവ് നൽകേണ്ടി വരുന്നു. ഒരു നേരിട്ടുള്ള API കോളിനേക്കാൾ 10 മുതൽ 32 മടങ്ങ് വരെ കൂടുതൽ ടോക്കണുകൾ നിങ്ങൾ ഉപയോഗിച്ചേക്കാം. മിക്ക ഡെവലപ്പർമാരും ഇത് ശ്രദ്ധിക്കാറില്ല.
MCP ഇക്കോസിസ്റ്റത്തിൽ 14,000 സെർവറുകളും പ്രതിമാസം 97 ദശലക്ഷം ഡൗൺലോഡുകളും ഉണ്ട്. എന്നിരുന്നാലും, വളരെ കുറച്ച് ട്യൂട്ടോറിയലുകൾ മാത്രമേ ഇതിന്റെ ചിലവിനെക്കുറിച്ച് പരാമർശിക്കുന്നുള്ളൂ.
ഇതാണ് പ്രശ്നം.
ഒരു LLM ഒരു MCP ടൂൾ ഉപയോഗിക്കുമ്പോൾ, സിസ്റ്റം ആ ടൂളിന്റെ മുഴുവൻ സ്കീമയും (schema) കോൺടെക്സ്റ്റ് വിൻഡോയിലേക്ക് അയക്കുന്നു. ഇതിൽ ഓരോ പാരാമീറ്ററും, ടൈപ്പും, വിവരണവും ഉൾപ്പെടുന്നു. ഒരു ലളിതമായ ഫയൽ സെർച്ച് പോലും 500 മുതൽ 2,000 വരെ ടോക്കണുകൾ ഉപയോഗിച്ചേക്കാം. ഇത് 50 തവണ ആവർത്തിച്ചാൽ, മെറ്റാഡാറ്റയ്ക്ക് (metadata) വേണ്ടി മാത്രം നിങ്ങൾ 100,000 ടോക്കണുകൾ ചെലവാക്കുന്നു.
കണക്ക് ലളിതമാണ്.
ദിവസം 500 തവണ കോൾ ചെയ്യുന്ന ഒരു ഏജന്റ് 250,000 മുതൽ 8 ദശലക്ഷം വരെ ടോക്കണുകൾ ഉപയോഗിക്കുന്നു. നിലവിലെ നിരക്കനുസരിച്ച്, ഒരു ഏജന്റിന് പ്രതിദിനം $200 മുതൽ $500 വരെ ചിലവ് വരും. എന്നാൽ ഒപ്റ്റിമൈസ് ചെയ്ത ഏജന്റുകൾക്ക് $6 മുതൽ $50 വരെ മാത്രമേ ചിലവ് വരുന്നുള്ളൂ.
നിങ്ങളുടെ ചിലവ് കുറയ്ക്കാൻ ഈ മൂന്ന് രീതികൾ ഉപയോഗിക്കുക:
സ്കീമ മിനിമൈസേഷൻ (Schema minimization). മിക്ക MCP സെർവറുകളും അമിതമായി ടെക്സ്റ്റ് ഉപയോഗിക്കുന്നു. സ്കീമ ലഘൂകരിക്കുക. ആക്ഷൻ പേര്, ആവശ്യമായ പാരാമീറ്ററുകൾ, ഒരു വരിയിലുള്ള സംഗ്രഹം എന്നിവ മാത്രം അയക്കുക. ഇത് ഓവർഹെഡ് 40% മുതൽ 60% വരെ കുറയ്ക്കുന്നു.
ബാച്ച് ടൂൾ കോൾസ് (Batch tool calls). ഓരോ ആക്ഷനും ഓരോ കോൾ ചെയ്യുന്നതിന് പകരം, ബന്ധപ്പെട്ട പ്രവർത്തനങ്ങളെ ഒരു കോളിനുള്ളിൽ ഗ്രൂപ്പ് ചെയ്യുക. മിക്ക സെർവറുകളും അറേകൾ (arrays) കൈകാര്യം ചെയ്യാറുണ്ട്. ഇത് കോൺടെക്സ്റ്റ് ചിലവിനെ വിവിധ ടാസ്ക്കുകളിലേക്ക് വിഭജിക്കുന്നു.
റിസൾട്ട് കാഷിംഗ് (Result caching). നിങ്ങളുടെ ഏജന്റ് ഒരേ ഇൻപുട്ടുകൾ ഉപയോഗിച്ച് ഒരേ ടൂൾ തന്നെ വിളിക്കുന്നുണ്ടെങ്കിൽ, ഒരു കാഷെ (cache) ഉപയോഗിക്കുക. 60 സെക്കൻഡ് ഇൻ-മെമ്മറി കാഷെ ഉപയോഗിക്കുന്നത് ആവർത്തന കോളുകൾ ഒഴിവാക്കാൻ സഹായിക്കും.
ടോക്കൺ ചിലവിനെ ഒരു പ്രധാന അളവുകോലായി (metric) കാണുക. ലേറ്റൻസി (latency) അല്ലെങ്കിൽ കൃത്യത (accuracy) എന്നിവ മാത്രം നോക്കിയാൽ പോരാ.
വിജയിക്കാനുള്ള വഴികൾ: • ഒരു പുതിയ സെർവർ ഉപയോഗിക്കുന്നതിന് മുമ്പ് ടൂൾ ചിലവുകൾ പരിശോധിക്കുക. • ഓരോ സെഷനും ടോക്കൺ ബജറ്റുകൾ നിശ്ചയിക്കുക. • നീളമുള്ള ടെക്സ്റ്റിന് പകരം കോംപാക്ട് ആയ JSON നൽകുന്ന സെർവറുകൾ തിരഞ്ഞെടുക്കുക.
MCP ഇക്കോസിസ്റ്റം ശക്തമാണ്. മിനിറ്റുകൾക്കുള്ളിൽ പുതിയ കഴിവുകൾ ചേർക്കാൻ ഇത് നിങ്ങളെ അനുവദിക്കുന്നു. എന്നാൽ കോൺടെക്സ്റ്റ് ടാക്സ് എന്നത് യാഥാർത്ഥ്യമാണ്.
നിങ്ങൾ പ്രൊഡക്ഷനിൽ ഏജന്റുകൾ പ്രവർത്തിപ്പിക്കുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചിലവുകൾ കൃത്യമായി കണക്കാക്കുക. ഒരു പ്രോജക്റ്റ് വലിയ രീതിയിൽ വളരുന്നതും (scale), ബില്ല് വരുമ്പോൾ പരാജയപ്പെടുന്നതും തമ്മിലുള്ള വ്യത്യാസം ഒപ്റ്റിമൈസേഷൻ ആണ്.
നിങ്ങൾ എത്ര ചിലവാക്കുന്നു എന്ന് അറിയുക.
Optional learning community: https://t.me/GyaanSetuAi