𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: எனது நேர்மையான கருத்து
எனது முதல் ஃப்ரீலான்ஸ் (freelance) வேலையைச் செய்ய நான் தயாராகிவிட்டதாக நினைத்தேன். ஆனால், பிறகு AI செலவுகளைப் பார்த்தேன்.
ஒரு தரவரிசை (ranking) திட்டத்திற்காக Claude 3.5 Sonnet-ஐப் பயன்படுத்தத் திட்டமிட்டிருந்தேன். அதன் விலையைப் பார்த்ததும் நான் பதற்றமடைந்தேன். உயர்தர மாடல்களுக்கு (top-tier models) ஒரு மில்லியன் அவுட்புட் டோக்கன்களுக்கு (output tokens) $10.00 வரை செலவாகிறது. எனது வாடிக்கையாளரிடம் மிகக் குறைவான பட்ஜெட் மட்டுமே உள்ளது. டோக்கன்களுக்காக இவ்வளவு செலவு செய்ய என்னால் முடியாது.
மாற்று வழிகளைத் தேடியபோது, பலவிதமான விருப்பங்களைக் கண்டறிந்தேன். சில மாடல்களின் விலை $0.01 ஆக இருந்தது, மற்றவை $3.50 ஆக இருந்தன. பிரபலமான மாடல்களுக்கும் மலிவான மாடல்களுக்கும் இடையிலான வித்தியாசம் மிகக் குறைவு என்பதை நான் உணர்ந்தேன்.
நான் கண்டறிந்த விலை ஒப்பீடு இதோ:
• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output
GPT-4o ஆனது DeepSeek V4 Flash-ஐ விட ஏறத்தாழ பத்து மடங்கு அதிக விலை கொண்டது. ஆனால் தரத்தில் அந்த பத்து மடங்கு வித்தியாசம் இல்லை. பெஞ்ச்மார்க் (Benchmarks) முடிவுகள் காட்டுவது என்னவென்றால், மலிவான மாடல்களும் பிரபலமான மாடல்களுக்கு மிக நெருக்கமான தரத்தையே வழங்குகின்றன.
நீங்கள் ஒரு மாதத்திற்கு 1 மில்லியன் தரவரிசை அழைப்புகளை (ranking calls) இயக்கினால்:
• GPT-4o ஒரு மாதத்திற்கு $3,250 செலவாகும். • DeepSeek V4 Flash ஒரு மாதத்திற்கு $355 செலவாகும்.
நீங்கள் ஒவ்வொரு மாதமும் $2,895 சேமிக்கலாம்.
இந்த மாடல்களைச் சோதிக்கும்போது நான் கற்றுக்கொண்ட ஐந்து பாடங்கள் இதோ:
- கேச்சிங் (caching) முறையைப் பயன்படுத்துங்கள். உங்கள் ப்ராம்ப்ட்களில் (prompts) 40% ஒரே மாதிரியாக இருந்தால், நீங்கள் 40% செலவைக் குறைக்கலாம்.
- பதில்களை ஸ்ட்ரீம் (stream) செய்யுங்கள். ஒரு லோடிங் ஐகானைப் (loading icon) பார்த்துக் கொண்டிருப்பதை விட, வார்த்தைகள் ஒவ்வொன்றாகத் திரையில் தோன்றுவதையே பயனர்கள் விரும்புகிறார்கள்.
- பணத்திற்கு ஏற்ற மாடலைத் தேர்ந்தெடுங்கள். சிக்கலான காரணக்கருத்துகளுக்கு (complex reasoning) விலையுயர்ந்த மாடல்களைப் பயன்படுத்துங்கள். எளிய வகைப்படுத்துதல் (classification) அல்லது தரவரிசைப்படுத்துதலுக்கு (ranking) மலிவான மாடல்களைப் பயன்படுத்துங்கள்.
- தரத்தை மேனுவலாக (manually) கண்காணிக்கவும். செலவுகளுடன் சேர்த்து பயனர்களின் திருப்தியையும் கவனியுங்கள்.
- ஒரு மாற்று வழியை (fallback) உருவாக்கி வையுங்கள். ஒரு API அதன் வரம்பை (rate limit) எட்டும்போது உங்கள் ஆப் செயலிழக்காமல் இருக்க, உங்கள் கோடில் (code) இரண்டாவது மாடலைப் பயன்படுத்துங்கள்.
மலிவான விலையிலேயே தொடங்குங்கள். அதிகப்படியான வேலைகளுக்கு DeepSeek V4 Flash போன்ற மாடல்களைப் பயன்படுத்துங்கள். தரம் மிக முக்கியமாகத் தேவைப்படும் பணிகளுக்காக மட்டுமே விலையுயர்ந்த மாடல்களைச் சேமித்து வையுங்கள்.
Source: https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l
Optional learning community: https://t.me/GyaanSetuAi