𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗹𝘄𝗻 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗣𝗮𝗻𝗱𝗮𝗻𝗴𝗮𝗻 𝗝𝘂𝗷𝘂𝗿 𝗦𝗮𝘆𝗮
Saya fikir saya sudah bersedia untuk tugasan freelance pertama saya. Kemudian saya melihat kos AI.
Saya merancang untuk menggunakan Claude 3.5 Sonnet untuk projek pemeringkatan. Saya melihat harga yang ditetapkan dan mula panik. Model tahap tinggi menelan kos $10.00 bagi setiap satu juta token output. Pelanggan saya mempunyai bajet yang ketat. Saya tidak mampu membazirkan wang begitu sahaja untuk token.
Saya mencari alternatif dan menemui pelbagai pilihan yang luas. Sesetengah model berharga $0.01 manakala yang lain berharga $3.50. Saya menyedari bahawa jurang antara model terkenal dan model yang lebih murah adalah kecil.
Berikut adalah perbandingan harga yang saya temui:
• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output
GPT-4o adalah kira-kira sepuluh kali lebih mahal daripada DeepSeek V4 Flash. Perbezaan kualitinya pula tidak mencecah sepuluh kali ganda. Penanda aras (benchmarks) menunjukkan model yang lebih murah kekal dalam perbezaan beberapa peratusan sahaja berbanding nama-nama besar.
Jika anda menjalankan 1 juta panggilan pemeringkatan sebulan:
• GPT-4o menelan kos $3,250 sebulan. • DeepSeek V4 Flash menelan kos $355 sebulan.
Anda menjimatkan $2,895 setiap bulan.
Berikut adalah lima pengajaran yang saya pelajari semasa menguji model-model ini:
- Gunakan caching. Jika 40% daripada prompt anda adalah serupa, anda menjimatkan 40% kos.
- Gunakan streaming untuk respons anda. Pengguna lebih suka melihat perkataan muncul daripada merenung ikon pemuatan (loading icon).
- Padankan model dengan tugasan. Gunakan model mahal untuk penaakulan (reasoning) yang kompleks. Gunakan model murah untuk klasifikasi atau pemeringkatan yang mudah.
- Pantau kualiti secara manual. Jejaki kepuasan pengguna seiring dengan kos anda.
- Bina fallback. Gunakan model kedua dalam kod anda supaya aplikasi anda tidak terhenti (crash) apabila API mencapai had kadar (rate limit).
Bermula dengan yang murah. Gunakan model seperti DeepSeek V4 Flash untuk kerja pukal. Simpan model yang mahal untuk tugasan di mana kualiti adalah kritikal.
Sumber: https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi