𝗜 𝗡𝗶𝗹𝗶𝗶𝗹𝗶𝗻𝗴𝗮𝗻𝗶𝘀𝗵𝗮 𝗤𝘄𝗲𝗻 𝗻𝗮 𝗚𝗣𝗧-𝟰𝗼

Nilipata bili ya kila mwezi ya $4,200 kutoka OpenAI kwa kazi rahisi. Hii ilinilazimu kujaribu mifumo mingine.

Nilitumia wiki sita nikilinganisha Qwen na GPT-4o. Nilitumia maelekezo (prompts) 1,247 katika kategoria tano:

Matokeo yanaonyesha kuwa gharama kubwa haimaanishi kila wakati ubora wa juu.

Matokeo ya Data:

Nilinganisha mifumo mitano dhidi ya GPT-4o. Hapa kuna wastani wa alama zilizozingatia uzito:

Pengo kati ya GPT-4o na Qwen3-32B ni dogo katika kazi za uainishaji. Hata hivyo, GPT-4o unashinda kwa kiasi kikubwa katika uwezo wa kufikiri.

Athari ya Gharama:

Nilitabiri gharama kulingana na tokeni 47 milioni za kuingiza (input) na tokeni 12 milioni za kutolea (output) kwa mwezi.

Bili yangu ya $4,200 ingeweza kuwa $339 huku ikitoa ubora ule ule.

Jinsi Nilivyorekebisha Mfumo Wangu (Pipeline):

Nilihama kwenye mfumo wa kuelekeza kwa ngazi (tiered routing system). Ninatumia mfumo mdogo kutathmini ugumu wa kazi.

Pia niliongeza semantic caching. Hii inaniruhusu kutumia tena majibu kwa maswali yanayofanana. Ilipunguza matumizi yangu ya LLM kwa 40%.

Mwongozo Wangu wa Maamuzi:

Mifumo ya bei nafuu mara nyingi huwa na latency bora pia. Ikiwa watumiaji wako wanahitaji majibu ya haraka, kagua tokeni kwa sekunde kabla ya kuchagua.

Chanzo: https://dev.to/rarenode/i-benchmarked-qwen-against-gpt-4o-a-data-scientists-raw-numbers-3d6a