مجموعة أدوات واجهة برمجة تطبيقات الذكاء الاصطناعي التي أنقذت شركتي الناشئة

قبل ستة أشهر، واجهت فاتورة شهرية بقيمة 50,000 دولار من مزود واحد لنماذج اللغة الكبيرة (LLM). كانت شركتي الناشئة في مأزق؛ فقد كنا نعتمد بشكل مفرط على مورد واحد.

أدركتُ أنه يجب عليّ التعامل مع البنية التحتية للذكاء الاصطناعي كبنية تحتية حقيقية. توقفتُ عن التعامل مع الذكاء الاصطناعي كلعبة، وبدأتُ في التعامل معه كتكلفة أساسية للأعمال.

تتجاهل معظم أدلة الذكاء الاصطناعي مسألة التوسع. فهي تعرض لك نماذج تجريبية ولكنها تتجاهل الفواتير الفعلية. لقد قمت بتشغيل ميزات الذكاء الاصطناعي لمدة عامين، ورأيت ما يحدث عندما تتوسع لتصل إلى مئات الآلاف من المستخدمين.

إذا اخترت المزود الخاطئ في اليوم الأول، فقد لا تنجو من مرحلة الإطلاق واسع الانتشار.

الهدف بسيط. أنت بحاجة إلى ثلاثة أشياء:

  • تكاليف يمكن التنبؤ بها لكل توكن (token).
  • القدرة على تبديل النماذج فوراً.
  • أنظمة رصيد لا تنتهي صلاحيتها.

لقد ارتكبتُ خطأً في البداية؛ حيث قمت بالربط مباشرة مع عدة مزودين. كان لكل واحد منهم SDK مختلف وعمليات مصادقة (auth flows) مختلفة. إذا أردت اختبار نموذج جديد، كان عليّ التسجيل من جديد. وإذا أردت التبديل، كان عليّ إعادة كتابة الكود الخاص بي.

الآن، أستخدم بوابة موحدة (unified gateway). هذا يغير كل شيء.

مقارنة بين الاستراتيجيات:

الربط المباشر مقابل البوابة الموحدة

  • تبديل المزود: إعادة كتابة الكود مقابل تغيير نص واحد (string)
  • الدفع: عقبات إقليمية مقابل بطاقات قياسية
  • الاختبار: عملية تسجيل كاملة مقابل الوصول بمفتاح واحد
  • وقت التشغيل: نقطة فشل واحدة مقابل تجاوز الفشل التلقائي (automatic failover)

تسمح لك البوابة الموحدة بتوجيه المهام بناءً على الحاجة. فأنت لا تحتاج إلى GPT-4o لكل شيء.

منطق التوجيه الحالي لدي:

  • التلخيص والاستخراج: استخدم أرخص نموذج.
  • الدردشة البسيطة: استخدم نموذجاً من الفئة المتوسطة.
  • الاستنتاج المعقد: استخدم نموذجاً متميزاً (premium).

معظم حركة البيانات لدينا تعمل على الفئة الأرخص. هذا يحافظ على انخفاض تكاليفنا مع الحفاظ على الجودة. نحن نحتفظ بالنماذج المتميزة لـ 5% فقط من مهامنا.

في مرحلة النمو الحالية، يوفر لنا هذا التوجيه ما يقرب من 500,000 دولار من السيولة السنوية (annual runway). هذا ليس مجرد اختيار لأداة، بل هو خيار للبقاء.

توقف عن شراء ميزات الشركات الكبرى (enterprise) في وقت مبكر جداً. لا تدفع مقابل اتفاقيات مستوى الخدمة (SLAs) أو سعة مخصصة إذا لم يكن لديك عملاء من الشركات الكبرى بعد. وفر تلك الأموال، وابنِ نظامك من أجل المرونة أولاً.

عندما تتوسع، سيظل نمط البوابة يعمل. كل ما عليك فعله هو تغيير مفتاح API الخاص بك وشروطك التجارية، وسيبقى الكود الخاص بك كما هو.

ابنِ نظام التوجيه (router) الخاص بك منذ اليوم الأول. اجعل رابط URL الأساسي موحداً. واجعل أسماء النماذج جزءاً من الإعدادات (configuration) وليس جزءاً من الكود.

المصدر: https://dev.to/truelane/the-ai-api-stack-that-saved-my-startup-from-vendor-lock-in-50l6

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi