𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲
എന്റെ ആദ്യത്തെ ഫ്രീലാൻസ് ജോലി ചെയ്യാൻ ഞാൻ തയ്യാറാണെന്നാണ് ഞാൻ കരുതിയത്. എന്നാൽ AI ചിലവുകൾ കണ്ടപ്പോൾ ഞാൻ ഞെട്ടിപ്പോയി.
ഒരു റാങ്കിംഗ് പ്രോജക്റ്റിനായി Claude 3.5 Sonnet ഉപയോഗിക്കാനാണ് ഞാൻ പദ്ധതിയിട്ടത്. അതിന്റെ വില കണ്ടപ്പോൾ ഞാൻ പരിഭ്രമിച്ചു. മികച്ച മോഡലുകൾക്ക് ഒരു മില്യൺ ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $10.00 വരെ ചിലവ് വരും. എന്റെ ക്ലയന്റിന് കർശനമായ ബജറ്റുണ്ട്. ടോക്കണുകൾക്കായി ഇത്രയും വലിയ തുക ചിലവാക്കാൻ എനിക്ക് കഴിയില്ലായിരുന്നു.
ഞാൻ മറ്റ് ബദലുകൾക്കായി തിരയുകയും വലിയൊരു നിരവതി ഓപ്ഷനുകൾ കണ്ടെത്തുകയും ചെയ്തു. ചില മോഡലുകൾക്ക് $0.01 മാത്രം ചിലവ് വരുമ്പോൾ മറ്റു ചിലതിന് $3.50 വരെ വരുന്നു. പ്രശസ്തമായ മോഡലുകളും വില കുറഞ്ഞവയും തമ്മിലുള്ള വ്യത്യാസം വളരെ കുറവാണെന്ന് ഞാൻ മനസ്സിലാക്കി.
ഞാൻ കണ്ടെത്തിയ വില താരതമ്യം ഇതാ:
• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output
DeepSeek V4 Flash-നെ അപേക്ഷിച്ച് GPT-4o ഏകദേശം പത്തിരട്ടി ചിലവേറിയതാണ്. എന്നാൽ ഗുണനിലവാരത്തിലുള്ള വ്യത്യാസം പത്തിരട്ടിയല്ല. പ്രശസ്തമായ മോഡലുകളിൽ നിന്ന് ഏതാനും ശതമാനം വ്യത്യാസത്തിൽ മാത്രമേ വില കുറഞ്ഞ മോഡലുകൾ നിൽക്കുന്നുള്ളൂ എന്ന് ബെഞ്ച്മാർക്കുകൾ കാണിക്കുന്നു.
നിങ്ങൾ പ്രതിമാസം 1 മില്യൺ റാങ്കിംഗ് കോളുകൾ നടത്തുന്നുണ്ടെങ്കിൽ:
• GPT-4o-യ്ക്ക് പ്രതിമാസം $3,250 ചിലവ് വരും. • DeepSeek V4 Flash-ന് പ്രതിമാസം $355 ചിലവ് വരും.
നിങ്ങൾക്ക് ഓരോ മാസവും $2,895 ലാഭിക്കാം.
ഈ മോഡലുകൾ പരീക്ഷിച്ചപ്പോൾ ഞാൻ പഠിച്ച അഞ്ച് പാഠങ്ങൾ ഇതാ:
- Caching ഉപയോഗിക്കുക. നിങ്ങളുടെ പ്രോംപ്റ്റുകളിൽ 40% ഒന്നുതന്നെയാണെങ്കിൽ, നിങ്ങൾക്ക് 40% ചിലവ് ലാഭിക്കാം.
- റെസ്പോൺസുകൾ സ്ട്രീം (Stream) ചെയ്യുക. ഒരു ലോഡിംഗ് ഐക്കൺ നോക്കി നിൽക്കുന്നതിനേക്കാൾ വാക്കുകൾ തെളിഞ്ഞു വരുന്നത് കാണാനാണ് ഉപയോക്താക്കൾ ഇഷ്ടപ്പെടുന്നത്.
- ജോലിക്കനുസരിച്ച് മോഡലുകളെ തിരഞ്ഞെടുക്കുക. സങ്കീർണ്ണമായ കാര്യങ്ങൾക്കായി (complex reasoning) വിലകൂടിയ മോഡലുകൾ ഉപയോഗിക്കുക. ലളിതമായ വർഗ്ഗീകരണത്തിനോ (classification) റാങ്കിംഗിനോ വില കുറഞ്ഞ മോഡലുകൾ ഉപയോഗിക്കുക.
- ഗുണനിലവാരം നേരിട്ട് പരിശോധിക്കുക. ചിലവിനൊപ്പം ഉപയോക്താക്കളുടെ സംതൃപ്തിയും നിരീക്ഷിക്കുക.
- ഒരു ഫാള்பാക്ക് (Fallback) തയ്യാറാക്കുക. ഒരു API-യുടെ റേറ്റ് ലിമിറ്റ് (rate limit) എത്തുമ്പോൾ നിങ്ങളുടെ ആപ്പ് ക്രാഷ് ആകാതിരിക്കാൻ കോഡിൽ രണ്ടാമതൊരു മോഡൽ കൂടി ഉൾപ്പെടുത്തുക.
കുറഞ്ഞ ചിലവിൽ തുടങ്ങുക. വലിയ ജോലികൾക്കായി DeepSeek V4 Flash പോലുള്ള മോഡലുകൾ ഉപയോഗിക്കുക. ഗുണനിലവാരം വളരെ പ്രധാനപ്പെട്ട ജോലികൾക്കായി മാത്രം വിലകൂടിയ മോഡലുകൾ മാറ്റിവെക്കുക.
Source: https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l
Optional learning community: https://t.me/GyaanSetuAi