𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲

📅3 hours ago⏱2 min read

𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗹𝘄𝗻 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗣𝗮𝗻𝗱𝗮𝗻𝗴𝗮𝗻 𝗝𝘂𝗷𝘂𝗿 𝗦𝗮𝘆𝗮

Saya fikir saya sudah bersedia untuk tugasan freelance pertama saya. Kemudian saya melihat kos AI.

Saya merancang untuk menggunakan Claude 3.5 Sonnet untuk projek pemeringkatan. Saya melihat harga yang ditetapkan dan mula panik. Model tahap tinggi menelan kos $10.00 bagi setiap satu juta token output. Pelanggan saya mempunyai bajet yang ketat. Saya tidak mampu membazirkan wang begitu sahaja untuk token.

Saya mencari alternatif dan menemui pelbagai pilihan yang luas. Sesetengah model berharga $0.01 manakala yang lain berharga $3.50. Saya menyedari bahawa jurang antara model terkenal dan model yang lebih murah adalah kecil.

Berikut adalah perbandingan harga yang saya temui:

• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output

GPT-4o adalah kira-kira sepuluh kali lebih mahal daripada DeepSeek V4 Flash. Perbezaan kualitinya pula tidak mencecah sepuluh kali ganda. Penanda aras (benchmarks) menunjukkan model yang lebih murah kekal dalam perbezaan beberapa peratusan sahaja berbanding nama-nama besar.

Jika anda menjalankan 1 juta panggilan pemeringkatan sebulan:

• GPT-4o menelan kos $3,250 sebulan. • DeepSeek V4 Flash menelan kos $355 sebulan.

Anda menjimatkan $2,895 setiap bulan.

Berikut adalah lima pengajaran yang saya pelajari semasa menguji model-model ini:

Gunakan caching. Jika 40% daripada prompt anda adalah serupa, anda menjimatkan 40% kos.
Gunakan streaming untuk respons anda. Pengguna lebih suka melihat perkataan muncul daripada merenung ikon pemuatan (loading icon).
Padankan model dengan tugasan. Gunakan model mahal untuk penaakulan (reasoning) yang kompleks. Gunakan model murah untuk klasifikasi atau pemeringkatan yang mudah.
Pantau kualiti secara manual. Jejaki kepuasan pengguna seiring dengan kos anda.
Bina fallback. Gunakan model kedua dalam kod anda supaya aplikasi anda tidak terhenti (crash) apabila API mencapai had kadar (rate limit).

Bermula dengan yang murah. Gunakan model seperti DeepSeek V4 Flash untuk kerja pukal. Simpan model yang mahal untuk tugasan di mana kualiti adalah kritikal.

Sumber: https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi

𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲

Continue reading

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗖𝗼𝘀𝘁𝘀 𝟲𝟬% 𝗪𝗶𝘁𝗵 𝗧𝗵𝗶𝘀 𝗥𝗔𝗚 𝗦𝗲𝘁𝘂𝗽

Bagaimana Saya Membina Chatbot AI WordPress dengan Bajet Terhad

𝗜 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗲𝗱 𝗤𝘄𝗲𝗻 𝗔𝗴𝗮𝗶𝗻𝘀𝘁 𝗚𝗣𝗧 𝟰𝗼

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

Adakah Anda Memerlukan AI Paling Canggih untuk Kerja Harian?