𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗟𝗮𝗿𝗴𝗲 𝘃𝘀 𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗠𝗲𝗱𝗶𝘂𝗺: 𝗖𝗧𝗢 𝗡𝗼𝘁𝗲𝘀 𝗙𝗿𝗼𝗺 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻

മൂന്ന് മാസം മുമ്പ്, ഞാൻ ഒരു LLM ഫീച്ചർ പുറത്തിറക്കി. അതിനുശേഷം ബില്ല് വന്നു.

ഞാൻ ഒരു തെറ്റ് ചെയ്തു എന്ന് എനിക്ക് മനസ്സിലായി. Mistral Medium ഉപയോഗിക്കേണ്ട സ്ഥാനത്ത് ഞാൻ Mistral Large ആണ് ഉപയോഗിച്ചത്. ഇത് ആവശ്യത്തിലധികം ഏകദേശം 4 മടങ്ങ് അധികം ചിലവാകാൻ കാരണമായി.

നിങ്ങൾ ഒരു സ്റ്റാർട്ടപ്പ് നടത്തുന്നുണ്ടെങ്കിൽ, വെറും തോന്നലുകളുടെ (vibes) അടിസ്ഥാനത്തിൽ ആർക്കിടെക്ചർ തീരുമാനങ്ങൾ എടുക്കാൻ കഴിയില്ല. നിങ്ങൾ അവ ROI അടിസ്ഥാനത്തിൽ വേണം എടുക്കാൻ.

ആ തെറ്റ് ലളിതമാണ്. വലിയ മോഡലുകൾ എപ്പോഴും മികച്ചതാണെന്ന് ഞാൻ കരുതി. ഞാൻ തെറ്റിദ്ധരിച്ചു.

ഇപ്പോൾ ഞാൻ LLM ചിലവുകൾ കൈകാര്യം ചെയ്യുന്നത് ഇങ്ങനെയാണ്:

  1. ജോലിയുടെ സങ്കീർണ്ണത തരംതിരിക്കുക (Classify task complexity)
  1. ടോക്കൺ വോളിയം (token volume) കണക്കാക്കുക
  1. യഥാർത്ഥ മൂല്യനിർണ്ണയങ്ങളിലൂടെ (evals) അളക്കുക

എന്റെ ജോലികളിൽ 70 ശതമാനത്തിനും Mistral Medium മതിയാകും. സപ്പോർട്ട് ടിക്കറ്റ് ക്ലാസിഫിക്കേഷൻ ഇത് കൃത്യമായി ചെയ്യുന്നു. Large ഉപയോഗിക്കുന്ന ചിലവിന്റെ മൂന്നിലൊന്ന് മാത്രമേ ഇതിന് ചെലവ് വരുന്നുള്ളൂ. ഉയർന്ന തലത്തിലുള്ള റീസണിംഗ് ജോലികൾക്കായി ഞാൻ Large മാറ്റിവെക്കുന്നു.

ഞാൻ വെണ്ടർ ലോക്ക്-ഇൻ (vendor lock-in) ഒഴിവാക്കുന്നുമുണ്ട്. പല മോഡലുകളും ഉപയോഗിക്കാൻ ഞാൻ ഒരു യൂണിഫൈഡ് എൻഡ്പോയിന്റ് (unified endpoint) ഉപയോഗിക്കുന്നു. ഒരു പ്രൊവൈഡർ വില കൂട്ടിയാൽ, മിനിറ്റുകൾക്കുള്ളിൽ എനിക്ക് മോഡലുകൾ മാറ്റാൻ കഴിയും. ഇത് എന്റെ റൺവേയെ (runway) സംരക്ഷിക്കുന്നു.

CTO-കൾക്കുള്ള എന്റെ ഉപദേശം:

ചെറിയ ചുറ്റിക ആവശ്യമുള്ള ജോലികൾക്കായി വലിയ ചുറ്റിക ഉപയോഗിക്കുന്നത് നിർത്തുക. കാര്യക്ഷമത മത്സരപരമായ നേട്ടങ്ങൾ നൽകുന്നു. ഇത് ഉപഭോക്താക്കൾക്ക് മികച്ച ഫീച്ചറുകളും കുറഞ്ഞ വിലയും വാഗ്ദാനം ചെയ്യാൻ നിങ്ങളെ സഹായിക്കുന്നു.

Source: https://dev.to/gentlenode/mistral-large-vs-mistral-medium-cto-notes-from-production-280f