GPT يفعل أكثر مما تظن

تغير نماذج GPT طريقة تعاملنا مع النصوص.

بدأت الرحلة مع GPT-1، حيث أظهرت أن الآلات يمكنها كتابة جمل متماسكة. ثم جاء GPT-2 ليظهر مدى الإمكانات التي تمتلكها هذه النماذج. وبعد ذلك وصل GPT-3، وبفضل امتلاكه 175 مليار معلمة (parameter)، أثبت أن النماذج يمكنها القيام بما هو أكثر من مجرد إكمال جملة.

السر يكمن في بنية Transformer. فهي تتعلم الأنماط من كميات هائلة من البيانات. لست بحاجة لبرمجة كل قاعدة؛ إذ يمكنك ضبطها بدقة (fine-tune) لمهام محددة أو استخدام اللغة الطبيعية لتوجيهها.

لكن تشغيل هذه النماذج في بيئة الإنتاج أمر صعب.

يمكن لزمن الاستجابة (latency) المرتفع أن يفسد تجربة المستخدم. لقد قمنا بتشغيل نماذج ضخمة على 64 وحدة معالجة رسومية من نوع Nvidia H100، وكان التأخير 120 مللي ثانية، وهو ما كان بطيئاً جداً لاحتياجاتنا. لذا انتقلنا إلى نموذج أصغر يحتوي على 6 مليارات معلمة باستخدام تقنية LoRA، مما خفض زمن الاستجابة إلى 38 مللي ثانية. كما وفر لنا ذلك 30,000 دولار شهرياً. وعلى الرغم من أننا فقدنا بعض الدقة في البرمجة، إلا أن السرعة والتكلفة جعلتا الأمر يستحق العناء.

يجب عليك أيضاً الحذر من الانحيازات. يتعلم GPT الأنماط من الإنترنت، مما يعني أنه قد يكرر الصور النمطية أو الأخطاء الواقعية، كما أنه يبدو واثقاً حتى عندما يكون مخطئاً.

لقد قمنا ببناء مسار بيانات (data pipeline) لرصد هذه الأخطاء، واستخدمنا محرك قواعد لتحديد اللغة المنحازة. في البداية، كانت 4% من التنبيهات خاطئة، ولكننا أصلحنا ذلك بإضافة نموذج تحقق صغير، مما خفض نسبة الأخطاء إلى أقل من 1%.

التكلفة والطاقة تشكلان أيضاً عقبات كبيرة.

يتطلب تدريب النماذج الضخمة ملايين الدولارات. نحن نستخدم تقنية التكميم (quantization) لخفض التكاليف. ومن خلال استخدام التكميم بدقة 4-bit، خفضنا تكلفة الـ token من 0.00015 دولار إلى 0.00004 دولار. وبالنسبة لمنتج SaaS ضخم، يوفر هذا 3 ملايين دولار سنوياً.

يتجه المستقبل نحو الكفاءة. فبدلاً من مجرد جعل النماذج أكبر، يعمل المطورون على جعلها أذكى وأصغر. نحن بحاجة إلى نماذج سريعة، رخيصة، وصادقة بشأن ما لا تعرفه.

استخدم هذه الأدوات بحكمة. افهم حدودها. وابنِ حواجز حماية (guardrails) لضمان بقائها مفيدة.

المصدر: https://dev.to/lavkeshdwivedi/gpt-does-more-than-you-think-fll

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi