ผมได้ลองทดสอบประสิทธิภาพ Qwen เทียบกับ GPT-4o

Machine-translated. Read the original.

📅3 hours ago⏱2 min read

ผมได้ทำการทดสอบประสิทธิภาพ (Benchmark) ของ Qwen เปรียบเทียบกับ GPT-4o

ผมต้องเผชิญกับบิลค่าใช้จ่ายรายเดือนจาก OpenAI สูงถึง 4,200 ดอลลาร์สำหรับงานง่ายๆ งานหนึ่ง สิ่งนี้ทำให้ผมต้องทดสอบโมเดลอื่นๆ

ผมใช้เวลาหกสัปดาห์ในการเปรียบเทียบ Qwen และ GPT-4o โดยใช้ Prompt ทั้งหมด 1,247 รายการ แบ่งเป็น 5 หมวดหมู่:

การจำแนกประเภท (Classification)
การสกัดข้อมูล (Extraction)
การสรุปความ (Summarization)
การสร้างโค้ด (Code generation)
การใช้เหตุผล (Reasoning)

ผลลัพธ์แสดงให้เห็นว่าค่าใช้จ่ายที่สูงกว่าไม่ได้หมายความว่าคุณภาพจะสูงกว่าเสมอไป

ผลลัพธ์ของข้อมูล:

ผมได้เปรียบเทียบโมเดล 5 รุ่นกับ GPT-4o และนี่คือคะแนนเฉลี่ยถ่วงน้ำหนัก:

GPT-4o: 0.

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱 Internal docs are often a mess. My team had too many pages. New hires struggled to find a…

AI 2 weeks ago · 1 min read

วิธีที่ผมลดต้นทุน AI ลงได้ถึง 60% ด้วยการตั้งค่า RAG แบบนี้

วิธีที่ผมลดต้นทุน AI ลงได้ถึง 60% ด้วยการตั้งค่า RAG แบบนี้ เมื่อสามเดือนก่อน ผมเกือบจะเลิกจ้างลูกค้าคนหนึ่ง ไม่ใช่เพราะพวกเขาเรื่องมาก แต่เป็นเพราะ...

WebDev 1 day ago · 2 min read

วิธีที่ฉันสร้าง AI Chatbot บน WordPress ในงบประหยัด

วิธีที่ฉันสร้าง AI Chatbot บน WordPress ในงบประหยัด ฉันต้องการ AI Chatbot สำหรับข้อมูลประกอบเว็บไซต์ WordPress ของฉัน เพราะฉันต้องการหยุดตอบคำถามเดิมๆ...

WebDev 20 hours ago · 2 min read

DeepSeek vs Claude 3.5 Sonnet: รีวิวจากมุมมองของฉันแบบตรงไปตรงมา

DeepSeek vs Claude 3.5 Sonnet: รีวิวจากมุมมองของฉันแบบตรงไปตรงมา ฉันคิดว่าตัวเองพร้อมสำหรับงานฟรีแลนซ์ชิ้นแรกแล้ว จนกระทั่งฉันได้เห็นค่าใช้จ่ายในการใช้ AI ฉันวางแผนที่จะใช้ Claud...

AI 1 hour ago · 2 min read

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀 I ran a three day benchmark to find the best coding AI models for 2026. I tested 10 models across 5 diff…

AI 43 minutes ago · 1 min read