میں نے کم بجٹ میں ورڈپریس اے آئی چیٹ بوٹ کیسے بنایا
مجھے اپنی ورڈپریس سائٹ کی دستاویزات (documentation) کے لیے ایک اے آئی چیٹ بوٹ کی ضرورت تھی۔ میں روزانہ ایک ہی طرح کی سپورٹ ای میلز کا جواب دینے سے تنگ آ چکا تھا۔
GPT-4o جیسے اعلیٰ درجے کے ماڈلز مہنگے ہیں۔ میں نے دیکھا کہ ان کی قیمت فی ملین ان پٹ ٹوکنز (input tokens) کے لیے $2.50 اور فی ملین آؤٹ پٹ ٹوکنز (output tokens) کے لیے $10.00 ہے۔ ایک چھوٹے سے سائیڈ پروجیکٹ کے لیے یہ قیمتیں بہت زیادہ ہیں۔
میں نے مختلف فراہم کنندگان (providers) کی جانچ پڑتال میں دو ہفتے گزارے۔ مجھے زیادہ اخراجات کے بغیر بہترین نتائج حاصل کرنے کا ایک طریقہ مل گیا۔
یہاں قیمتوں کا موازنہ ہے جو مجھے ملا:
• DeepSeek V4 Flash: $0.27 Input / $1.10 Output • DeepSeek V4 Pro: $0.55 Input / $2.20 Output • Qwen3-32B: $0.30 Input / $1.20 Output • GLM-4 Plus: $0.20 Input / $0.80 Output • GPT-4o: $2.50 Input / $10.00 Output
میں نے Global API پر منتقل ہونے کا فیصلہ کیا۔ یہ آپ کو ایک ہی اینڈ پوائنٹ (endpoint) کے ذریعے 184 مختلف ماڈلز تک رسائی فراہم کرتا ہے۔
اپنے سپورٹ بوٹ کے لیے، میں نے DeepSeek V4 Flash کا انتخاب کیا۔ یہ GPT-4o کے مقابلے میں بہت سستا ہے۔ تکنیکی سپورٹ کے کاموں کے لیے یہ تقریباً 84.6% اتنا ہی ذہین ہے۔ زیادہ تر صارفین کو صرف سادہ سوالات کے سادہ جوابات درکار ہوتے ہیں۔
میں نے اپنے اخراجات کم کرنے کے لیے تین اہم حکمت عملیوں کا استعمال کیا:
- Caching: میں عام جوابات کو محفوظ کرنے کے لیے Redis کا استعمال کرتا ہوں۔ صارفین اکثر ایک ہی طرح کے سوالات پوچھتے ہیں۔ 40% کیش ہٹ ریٹ (cache hit rate) نے میرے بل میں 30% کمی کی۔
- Streaming: میں نے اسٹریمنگ (streaming) کو فعال کیا ہے تاکہ الفاظ ایک ایک کر کے ظاہر ہوں۔ اس سے صارف کو بوٹ زیادہ تیز محسوس ہوتا ہے۔
- Right-sizing: میں آسان کاموں کے لیے سستے ماڈلز استعمال کرتا ہوں۔ پاس ورڈ ری سیٹ کرنے کا طریقہ بتانے کے لیے مجھے کسی انتہائی ذہین ماڈل کی ضرورت نہیں ہے۔
میرے نتائج: آپٹیمائزیشن (optimization) سے پہلے، میں ماہانہ $45 خرچ کرتا تھا۔ اب، میں ماہانہ $18 خرچ کرتا ہوں۔ یہ اخراجات میں 60% کی کمی ہے۔
اے آئی (AI) ٹولز بنانے کے لیے میرا مشورہ:
- ایک ہی جواب کے لیے دو بار ادائیگی سے بچنے کے لیے بھرپور طریقے سے کیشنگ (caching) کریں۔
- صارف کے تجربے کو بہتر بنانے کے لیے جوابات کو اسٹریمنگ (streaming) کے ذریعے فراہم کریں۔
- وہ سب سے سستا ماڈل منتخب کریں جو اپنا کام اچھی طرح انجام دے سکے۔
- تھمبز اپ (thumbs up) یا ڈاؤن (down) بٹنوں کے ذریعے معیار کی نگرانی کریں۔
- اگر آپ کا بنیادی فراہم کنندہ (provider) کام کرنا چھوڑ دے تو فال بیک (fallback) ماڈلز کا استعمال کریں۔
Source: https://dev.to/fiercedash/how-i-built-a-wordpress-ai-chatbot-without-going-broke-in-2026-4mmn