நான் Qwen-ஐ GPT-4o உடன் ஒப்பிட்டுச் சோதித்தேன்

ஒரு எளிய பணிக்காக OpenAI மூலம் எனக்கு மாதம் $4,200 கட்டணம் வந்தது. இது என்னை மற்ற மாடல்களைச் சோதித்துப் பார்க்கத் தூண்டியது.

Qwen மற்றும் GPT-4o ஆகியவற்றை ஒப்பிட்டுப் பார்க்க நான் ஆறு வாரங்கள் செலவிட்டேன். ஐந்து பிரிவுகளில் மொத்தம் 1,247 ப்ராம்ப்ட்களை (prompts) நான் பயன்படுத்தினேன்:

அதிக செலவு என்பது எப்போதும் அதிகத் தரத்தைக் குறிப்பதில்லை என்பதை முடிவுகள் காட்டுகின்றன.

தரவு முடிவுகள்:

நான் ஐந்து மாடல்களை GPT-4o உடன் ஒப்பிட்டேன். அவற்றின் சராசரி மதிப்பெண்கள் (weighted average scores) இதோ:

வகைப்படுத்துதல் பணிகளில் GPT-4o மற்றும் Qwen3-32B இடையிலான வித்தியாசம் மிகக் குறைவு. இருப்பினும், பகுத்தறிவு (reasoning) பணிகளில் GPT-4o கணிசமான வெற்றியைப் பெறுகிறது.

செலவுத் தாக்கம்:

மாதம் 47 மில்லியன் உள்ளீட்டு டோக்கன்கள் (input tokens) மற்றும் 12 மில்லியன் வெளியீட்டு டோக்கன்கள் (output tokens) ஆகியவற்றின் அடிப்படையில் நான் செலவுகளைக் கணக்கிட்டேன்.

அதே தரத்துடன் எனது $4,200 கட்டணத்தை $339 ஆகக் குறைத்திருக்க முடியும்.

எனது பைப்லைனை (pipeline) நான் எவ்வாறு சரி செய்தேன்:

நான் ஒரு அடுக்கு வழித்தட முறைக்கு (tiered routing system) மாறினேன். பணியின் கடினத்தன்மையைத் தீர்மானிக்க நான் ஒரு சிறிய மாடலைப் பயன்படுத்துகிறேன்.

நான் 'semantic caching'-ஐயும் சேர்த்தேன். இது ஒரே மாதிரியான வினவல்களுக்குப் பதில்களை மீண்டும் பயன்படுத்த அனுமதிக்கிறது. இது எனது LLM பயன்பாட்டைக் (hits) 40% குறைத்தது.

எனது முடிவு வழிகாட்டி:

மலிவான மாடல்கள் பெரும்பாலும் சிறந்த தாமத நேரத்தையும் (latency) கொண்டுள்ளன. உங்கள் பயனர்களுக்கு விரைவான பதில்கள் தேவைப்பட்டால், தேர்ந்தெடுப்பதற்கு முன் 'tokens per second'-ஐச் சரிபார்க்கவும்.

ஆதாரம்: https://dev.to/rarenode/i-benchmarked-qwen-against-gpt-4o-a-data-scientists-raw-numbers-3d6a