تكلفة دمج الذكاء الاصطناعي لدي كانت باهظة للغاية حتى غيرت أسلوبي

لقد أحببت ميزة التلخيص بالذكاء الاصطناعي الخاصة بي حتى وصلت الفاتورة.

في الشهر الماضي، قمت ببناء أداة لتلخيص المقالات الطويلة. استخدمت GPT-4 مع أمر (prompt) بسيط. عملت الأداة بشكل مثالي، وأحب المستخدمون الجودة.

ثم جاءت الفاتورة. كلفتني شهر واحد من الاستخدام أكثر من 1,200 دولار. كان عليّ إما إصلاح هذا الأمر أو إلغاء الميزة تمامًا.

حاولت القيام بعدة أشياء لإصلاح ذلك:

  • انتقلت إلى GPT-3.5-turbo. انخفضت التكلفة، لكن الجودة تراجعت، وأصبحت الملخصات غامضة.
  • حاولت استخدام هندسة الأوامر (prompt engineering). إضافة عبارة "كن محددًا" لم تساعد بشكل كافٍ.
  • حاولت تقليل حجم المدخلات باستخدام مكتبات استخراجية (extractive libraries). ساعد هذا، لكن التكاليف ظلت مرتفعة.

أدركت أنني كنت أستخدم مطرقة ضخمة لتدق مسمارًا صغيرًا.

الحل يكمن في مسار عمل (pipeline) مكون من خطوتين. حيث تدمج بين طريقتين مختلفتين للحصول على أفضل النتائج.

الخطوة 1: المرحلة الاستخراجية (Extractive Phase) استخدم أداة رخيصة وسريعة مثل TextRank لاختيار أفضل 5 إلى 10 جمل من المقال. هذا يزيل 90% من النص الزائد.

الخطوة 2: المرحلة التجريدية (Abstractive Phase) أرسل تلك الجمل القليلة فقط إلى نموذج صغير ورخيص مثل GPT-3.5-turbo. اطلب منه إعادة كتابة تلك الجمل في ملخص نظيف مكون من 3 نقاط.

خفض هذا النهج تكاليفي بنسبة 80%. وظلت الجودة قريبة من GPT-4 لأن النموذج عالج البيانات الأكثر أهمية فقط.

نصائح أخرى لبناء تطبيقات الذكاء الاصطناعي الخاصة بك:

  • استخدم التخزين المؤقت (caching). قم بتخزين النتائج باستخدام article hash حتى لا تدفع مقابل نفس الملخص مرتين.
  • استخدم الطبقات (layers). قم بتقسيم المهام المعقدة إلى مهام فرعية أصغر وأرخص.
  • ضع خطة بديلة (fallback). إذا كان المقال معقدًا للغاية، استخدم نموذجًا عالي الجودة مثل GPT-4 لتلك الحالات المحددة فقط.

توقف عن إرسال كتل ضخمة من النصوص إلى النماذج المكلفة. قم بتقليص البيانات أولاً.

كيف توازن بين جودة الذكاء الاصطناعي والتكلفة في منتجاتك؟ هل تستخدم نماذج مختلفة لمهام مختلفة؟

المصدر: https://dev.to/__c1b9e06dc90a7e0a676b/my-ai-integration-had-terrible-costs-until-i-changed-my-approach-pml