നിങ്ങളുടെ ഇമേജ് ജനറേഷൻ ബില്ല് വർദ്ധിപ്പിക്കുന്നത് എന്താണ്?

റെസല്യൂഷനോ പ്രോംപ്റ്റ് ദൈർഘ്യമോ ആണ് ഇമേജ് API ചിലവ് തീരുമാനിക്കുന്നത് എന്നാണ് മിക്കവരും കരുതുന്നത്. അവർക്ക് തെറ്റാണ്.

മോഡൽ, റെസല്യൂഷൻ, ഇമേജ് എണ്ണം, ക്വാളിറ്റി എന്നിങ്ങനെ നാല് ഘടകങ്ങളെ അടിസ്ഥാനമാക്കി ഞങ്ങൾ ഇമേജ് ജനറേഷൻ പരിശോധിച്ചു. ഞങ്ങൾക്ക് ലഭിച്ച ഫലങ്ങൾ ഇതാ.

ക്വാളിറ്റി കെണി

ചിലവ് നിയന്ത്രിക്കുന്ന ഏറ്റവും വലിയ ഘടകം ക്വാളിറ്റി സെറ്റിംഗ് ആണ്. മിക്ക API-കളും ലോ (low), മീഡിയം (medium), അല്ലെങ്കിൽ ഹൈ (high) ക്വാളിറ്റി തിരഞ്ഞെടുക്കാൻ അനുവദിക്കുന്നു.

gpt-image പോലുള്ള മോഡലുകളിൽ, നിങ്ങൾ ഓരോ ടോക്കണിനും (token) പണം നൽകണം. ഹൈ ക്വാളിറ്റി എന്നാൽ കൂടുതൽ പിക്സലുകൾ എന്നാണ് അർത്ഥമില്ല. പകരം, കൂടുതൽ റെൻഡറിംഗ് പരിശ്രമം (rendering effort) എന്നാണ് അർത്ഥം.

ഒരേ റെസല്യൂഷനിൽ ഒരേ പ്രോംപ്റ്റ് ഉപയോഗിച്ച് ഞങ്ങൾ പരീക്ഷിച്ചു. ഫയൽ സൈസ് മാറ്റമില്ലാതെ തുടർന്നു. എന്നിരുന്നാലും, ലോ-ക്വാളിറ്റി സെറ്റിംഗിനേക്കാൾ 36 മടങ്ങ് അധികം ഹൈ-ക്വാളിറ്റി സെറ്റിംഗിന് ചിലവ് വന്നു.

ഫയലിന്റെ വലയല്ല, മറിച്ച് മോഡൽ ചെയ്യുന്ന ജോലിക്കാണ് നിങ്ങൾ പണം നൽകുന്നത്.

പ്രധാന കണ്ടെത്തലുകൾ

• ചിലവ് പ്രോംപ്റ്റിനല്ല, ഇമേജിനാണ്. ടെക്സ്റ്റ്-ടു-ഇമേജ് (text-to-image) ഉപയോഗിക്കുമ്പോൾ, നിങ്ങളുടെ പ്രോംപ്റ്റ് ചിലവിൽ വലിയ മാറ്റം വരുത്തുന്നില്ല. എന്നാൽ ഇമേജ്-ടു-ഇമേജ് (image-to-image) ഉപയോഗിക്കുകയാണെങ്കിൽ, ഇൻപുട്ട് ഇമേജ് വലിയൊരു ചിലവായി മാറുന്നു.

• മോഡൽ തിരഞ്ഞെടുപ്പ് ചിലവിനെ 6 മടങ്ങ് വരെ സ്വാധീനിക്കും. വ്യത്യസ്ത ബില്ലിംഗ് രീതികൾ നിങ്ങളുടെ ആകെ ചിലവിൽ മാറ്റം വരുത്തും. ചില മോഡലുകൾ ഓരോ ടോക്കണിനും ചാർജ് ചെയ്യുമ്പോൾ, മറ്റുള്ളവ ഓരോ ഇമേജിനും നിശ്ചിത തുക (flat fee) ഈടാക്കുന്നു.

• റെസല്യൂഷൻ വലിയ സ്വാധീനം ചെലുത്തുന്നില്ല. റെസല്യൂഷൻ കൂട്ടുന്നത് എല്ലായ്പ്പോഴും ചിലവ് ആനുപാതികമായി വർദ്ധിപ്പിക്കണമെന്നില്ല. ചില മോഡലുകളിൽ, വലുപ്പം എത്രയായാലും ചിലവ് ഒരുപോലെയായിരിക്കും.

• കാഷിംഗ് (Caching) ഫലപ്രദമല്ല. പണം ലാഭിക്കാൻ പലരും പ്രോംപ്റ്റ് കാഷിംഗ് ഉപയോഗിക്കാൻ ശ്രമിക്കാറുണ്ട്. എന്നാൽ ഇമേജ് ജനറേഷൻ സ്റ്റേറ്റ്‌ലെസ്സ് (stateless) ആണ്. ബില്ല് കുറയ്ക്കാൻ പ്രോംപ്റ്റ് സ്റ്റേറ്റ് വീണ്ടും ഉപയോഗിക്കാൻ കഴിയില്ല.

• ബാച്ചിംഗ് (Batching) പണം ലാഭിക്കില്ല. ഒരൊറ്റ കോൾ വഴി നാല് ഇമേജുകൾ ജനറേറ്റ് ചെയ്യുന്നത് പലപ്പോഴും പ്രോംപ്റ്റിന് നാല് തവണ ബില്ല് വരാൻ കാരണമാകും. ഇതിൽ ചിലവ് പങ്കിടാൻ (cost sharing) കഴിയില്ല.

ഒരു മോഡൽ എങ്ങനെ തിരഞ്ഞെടുക്കാം

ലോ-ക്വാളിറ്റി ഡ്രാഫ്റ്റുകൾ അല്ലെങ്കിൽ തംബ്‌നെയിലുകൾ (thumbnails) ആവശ്യമാണെങ്കിൽ: ഓരോ ടോക്കണിനും പണം നൽകുന്ന (per-token) മോഡൽ ഉപയോഗിക്കുക. കുറഞ്ഞ നിലവാരമുള്ള ജോലികൾക്ക് ഇതാണ് ഏറ്റവും ലാഭകരം.

മീഡിയം അല്ലെങ്കിൽ ഹൈ-ക്വാളിറ്റി ഇമേജുകൾ ആവശ്യമാണെങ്കിൽ: ഓരോ ഇമേജിനും നിശ്ചിത തുക ഈടാക്കുന്ന (flat per-image) മോഡൽ ഉപയോഗിക്കുക. ഹൈ ക്വാളിറ്റിയിൽ ടോക്കൺ ചിലവ് കുതിച്ചുയരും. പ്രൊഫഷണൽ ജോലികൾക്ക് നിശ്ചിത തുക ഈടാക്കുന്ന രീതിയാണ് കൂടുതൽ പ്രവചിക്കാവുന്നതും സാധാരണയായി ലാഭകരവും.

ഇമേജ്-ടു-ഇമേജ് എഡിറ്റിംഗ് ആണ് ചെയ്യുന്നതെങ്കിൽ: ഫ്ലാറ്റ് പെർ-ഇമേജ് മോഡലുകൾ തിരഞ്ഞെടുക്കുക. അവ പലപ്പോഴും റഫറൻസ് ഇമേജുകൾ സൗജന്യമായി ഉൾപ്പെടുത്താറുണ്ട്. എന്നാൽ ടോക്കൺ മോഡലുകൾ ഓരോ റഫറൻസ് ഇമേജിനും അധിക ചാർജ് ഈടാക്കും.

എപ്പോഴും ഹൈ ക്വാളിറ്റി തിരഞ്ഞെടുക്കുന്നത് ഒഴിവാക്കുക. ജോലിയുടെ സ്വഭാവത്തിനനുസരിച്ച് ക്വാളിറ്റി ക്രമീകരിക്കുക.

Source: https://dev.to/synthorai/what-actually-drives-your-image-generation-bill-2bc2