𝗜 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗲𝗱 𝗤𝘄𝗲𝗻 𝗔𝗴𝗮𝗶𝗻𝘀𝘁 𝗚𝗣𝗧 𝟰𝗼

Machine-translated. Read the original.

📅3 hours ago⏱2 min read

𝗜 𝗡𝗶𝗹𝗶𝗶𝗹𝗶𝗻𝗴𝗮𝗻𝗶𝘀𝗵𝗮 𝗤𝘄𝗲𝗻 𝗻𝗮 𝗚𝗣𝗧-𝟰𝗼

Nilipata bili ya kila mwezi ya $4,200 kutoka OpenAI kwa kazi rahisi. Hii ilinilazimu kujaribu mifumo mingine.

Nilitumia wiki sita nikilinganisha Qwen na GPT-4o. Nilitumia maelekezo (prompts) 1,247 katika kategoria tano:

Uainishaji
Utoaji wa data
Muhtasari
Uundaji wa kodi
Uwezo wa kufikiri

Matokeo yanaonyesha kuwa gharama kubwa haimaanishi kila wakati ubora wa juu.

Matokeo ya Data:

Nilinganisha mifumo mitano dhidi ya GPT-4o. Hapa kuna wastani wa alama zilizozingatia uzito:

GPT-4o: 0.920
DeepSeek V4 Pro: 0.902
Qwen3-32B: 0.848
DeepSeek V4 Flash: 0.812
GLM-4 Plus: 0.750

Pengo kati ya GPT-4o na Qwen3-32B ni dogo katika kazi za uainishaji. Hata hivyo, GPT-4o unashinda kwa kiasi kikubwa katika uwezo wa kufikiri.

Athari ya Gharama:

Nilitabiri gharama kulingana na tokeni 47 milioni za kuingiza (input) na tokeni 12 milioni za kutolea (output) kwa mwezi.

GPT-4o: $237.50
DeepSeek V4 Pro: $52.25
Qwen3-32B: $28.50
DeepSeek V4 Flash: $25.89
GLM-4 Plus: $19.00

Bili yangu ya $4,200 ingeweza kuwa $339 huku ikitoa ubora ule ule.

Jinsi Nilivyorekebisha Mfumo Wangu (Pipeline):

Nilihama kwenye mfumo wa kuelekeza kwa ngazi (tiered routing system). Ninatumia mfumo mdogo kutathmini ugumu wa kazi.

Kazi rahisi huenda kwa DeepSeek V4 Flash.
Kazi za wastani huenda kwa Qwen3-32B.
Kazi ngumu huenda kwa DeepSeek V4 Pro au GPT-4o.

Pia niliongeza semantic caching. Hii inaniruhusu kutumia tena majibu kwa maswali yanayofanana. Ilipunguza matumizi yangu ya LLM kwa 40%.

Mwongozo Wangu wa Maamuzi:

Ikiwa unahitaji ubora wa juu na una bajeti inayobadilika: Tumia GPT-4o au DeepSeek V4 Pro.
Ikiwa unahitaji ubora lakini unataka kuokoa pesa: Tumia Qwen3-32B kwa upatanishaji wa akili (smart routing).
Ikiwa gharama ndiyo kipaumbele chako pekee: Tumia DeepSeek V4 Flash.
Ikiwa una kazi nyingi sana na rahisi: Tumia GLM-4 Plus.

Mifumo ya bei nafuu mara nyingi huwa na latency bora pia. Ikiwa watumiaji wako wanahitaji majibu ya haraka, kagua tokeni kwa sekunde kabla ya kuchagua.

Chanzo: https://dev.to/rarenode/i-benchmarked-qwen-against-gpt-4o-a-data-scientists-raw-numbers-3d6a

𝗜 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗲𝗱 𝗤𝘄𝗲𝗻 𝗔𝗴𝗮𝗶𝗻𝘀𝘁 𝗚𝗣𝗧 𝟰𝗼

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗖𝗼𝘀𝘁𝘀 𝟲𝟬% 𝗪𝗶𝘁𝗵 𝗧𝗵𝗶𝘀 𝗥𝗔𝗚 𝗦𝗲𝘁𝘂𝗽

Jinsi nilivyotengeneza Chatbot ya AI ya WordPress kwa Bajeti Ndogo

𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝘃𝘀 𝗖𝗹𝗮𝘂𝗱𝗲 𝟯.𝟱 𝗦𝗼𝗻𝗻𝗲𝘁: 𝗠𝘆 𝗛𝗼𝗻𝗲𝘀𝘁 𝗧𝗮𝗸𝗲

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀