𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲

📅3 hours ago⏱2 min read

എന്റെ ആദ്യത്തെ ഫ്രീലാൻസ് ജോലി ചെയ്യാൻ ഞാൻ തയ്യാറാണെന്നാണ് ഞാൻ കരുതിയത്. എന്നാൽ AI ചിലവുകൾ കണ്ടപ്പോൾ ഞാൻ ഞെട്ടിപ്പോയി.

ഒരു റാങ്കിംഗ് പ്രോജക്റ്റിനായി Claude 3.5 Sonnet ഉപയോഗിക്കാനാണ് ഞാൻ പദ്ധതിയിട്ടത്. അതിന്റെ വില കണ്ടപ്പോൾ ഞാൻ പരിഭ്രമിച്ചു. മികച്ച മോഡലുകൾക്ക് ഒരു മില്യൺ ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $10.00 വരെ ചിലവ് വരും. എന്റെ ക്ലയന്റിന് കർശനമായ ബജറ്റുണ്ട്. ടോക്കണുകൾക്കായി ഇത്രയും വലിയ തുക ചിലവാക്കാൻ എനിക്ക് കഴിയില്ലായിരുന്നു.

ഞാൻ മറ്റ് ബദലുകൾക്കായി തിരയുകയും വലിയൊരു നിരവതി ഓപ്ഷനുകൾ കണ്ടെത്തുകയും ചെയ്തു. ചില മോഡലുകൾക്ക് $0.01 മാത്രം ചിലവ് വരുമ്പോൾ മറ്റു ചിലതിന് $3.50 വരെ വരുന്നു. പ്രശസ്തമായ മോഡലുകളും വില കുറഞ്ഞവയും തമ്മിലുള്ള വ്യത്യാസം വളരെ കുറവാണെന്ന് ഞാൻ മനസ്സിലാക്കി.

ഞാൻ കണ്ടെത്തിയ വില താരതമ്യം ഇതാ:

• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output

DeepSeek V4 Flash-നെ അപേക്ഷിച്ച് GPT-4o ഏകദേശം പത്തിരട്ടി ചിലവേറിയതാണ്. എന്നാൽ ഗുണനിലവാരത്തിലുള്ള വ്യത്യാസം പത്തിരട്ടിയല്ല. പ്രശസ്തമായ മോഡലുകളിൽ നിന്ന് ഏതാനും ശതമാനം വ്യത്യാസത്തിൽ മാത്രമേ വില കുറഞ്ഞ മോഡലുകൾ നിൽക്കുന്നുള്ളൂ എന്ന് ബെഞ്ച്മാർക്കുകൾ കാണിക്കുന്നു.

നിങ്ങൾ പ്രതിമാസം 1 മില്യൺ റാങ്കിംഗ് കോളുകൾ നടത്തുന്നുണ്ടെങ്കിൽ:

• GPT-4o-യ്ക്ക് പ്രതിമാസം $3,250 ചിലവ് വരും. • DeepSeek V4 Flash-ന് പ്രതിമാസം $355 ചിലവ് വരും.

നിങ്ങൾക്ക് ഓരോ മാസവും $2,895 ലാഭിക്കാം.

ഈ മോഡലുകൾ പരീക്ഷിച്ചപ്പോൾ ഞാൻ പഠിച്ച അഞ്ച് പാഠങ്ങൾ ഇതാ:

Caching ഉപയോഗിക്കുക. നിങ്ങളുടെ പ്രോംപ്റ്റുകളിൽ 40% ഒന്നുതന്നെയാണെങ്കിൽ, നിങ്ങൾക്ക് 40% ചിലവ് ലാഭിക്കാം.
റെസ്‌പോൺസുകൾ സ്ട്രീം (Stream) ചെയ്യുക. ഒരു ലോഡിംഗ് ഐക്കൺ നോക്കി നിൽക്കുന്നതിനേക്കാൾ വാക്കുകൾ തെളിഞ്ഞു വരുന്നത് കാണാനാണ് ഉപയോക്താക്കൾ ഇഷ്ടപ്പെടുന്നത്.
ജോലിക്കനുസരിച്ച് മോഡലുകളെ തിരഞ്ഞെടുക്കുക. സങ്കീർണ്ണമായ കാര്യങ്ങൾക്കായി (complex reasoning) വിലകൂടിയ മോഡലുകൾ ഉപയോഗിക്കുക. ലളിതമായ വർഗ്ഗീകരണത്തിനോ (classification) റാങ്കിംഗിനോ വില കുറഞ്ഞ മോഡലുകൾ ഉപയോഗിക്കുക.
ഗുണനിലവാരം നേരിട്ട് പരിശോധിക്കുക. ചിലവിനൊപ്പം ഉപയോക്താക്കളുടെ സംതൃപ്തിയും നിരീക്ഷിക്കുക.
ഒരു ഫാള்பാക്ക് (Fallback) തയ്യാറാക്കുക. ഒരു API-യുടെ റേറ്റ് ലിമിറ്റ് (rate limit) എത്തുമ്പോൾ നിങ്ങളുടെ ആപ്പ് ക്രാഷ് ആകാതിരിക്കാൻ കോഡിൽ രണ്ടാമതൊരു മോഡൽ കൂടി ഉൾപ്പെടുത്തുക.

കുറഞ്ഞ ചിലവിൽ തുടങ്ങുക. വലിയ ജോലികൾക്കായി DeepSeek V4 Flash പോലുള്ള മോഡലുകൾ ഉപയോഗിക്കുക. ഗുണനിലവാരം വളരെ പ്രധാനപ്പെട്ട ജോലികൾക്കായി മാത്രം വിലകൂടിയ മോഡലുകൾ മാറ്റിവെക്കുക.

Source: https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l

Optional learning community: https://t.me/GyaanSetuAi

𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲

Continue reading

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗖𝗼𝘀𝘁𝘀 𝟲𝟬% 𝗪𝗶𝘁𝗵 𝗧𝗵𝗶𝘀 𝗥𝗔𝗚 𝗦𝗲𝘁𝘂𝗽

കുറഞ്ഞ ചിലവിൽ ഞാൻ എങ്ങനെ ഒരു വേർഡ്പ്രസ്സ് AI ചാറ്റ്ബോട്ട് നിർമ്മിച്ചു

𝗜 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗲𝗱 𝗤𝘄𝗲𝗻 𝗔𝗴𝗮𝗶𝗻𝘀𝘁 𝗚𝗣𝗧 𝟰𝗼

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

ദൈനംദിന ജോലികൾക്കായി നിങ്ങൾക്ക് ഏറ്റവും നൂതനമായ AI ആവശ്യമുണ്ടോ?