شركة Probably تجمع 9 ملايين دولار لمكافحة هلوسة النماذج اللغوية الكبيرة (LLMs) عبر الهندسة الدقيقة

مع تزايد اندماج النماذج اللغوية الكبيرة (LLMs) في سير العمل المهني، يواجه القطاع عقبة مستمرة: ميل حتى أكثر النماذج تقدمًا إلى الهلوسة. وتواجه الشركة الناشئة Probably هذا التحدي مباشرة، حيث نجحت في تأمين 9 ملايين دولار في جولة تمويل أولي بقيادة Andreessen Horowitz لبناء نهج أكثر صرامة وحتمية لتعزيز موثوقية الذكاء الاصطناعي.

التحرك نحو دقة تصل إلى 99.99%

تتمثل المهمة الأساسية لشركة Probably، بقيادة مؤسسها Peter Elias، في سد الفجوة بين الطبيعة الاحتمالية للنماذج اللغوية الكبيرة ومعيار الدقة البالغ 99.99% المتوقع من الأنظمة الحتمية. ففي البيئات عالية المخاطر، يمكن لخطأ واقعي واحد أن يجعل أداة الذكاء الاصطناعي عديمة الفائدة. ولحل هذه المشكلة، تبتعد Probably عن فكرة أن الدقة هي مجرد نتيجة لحجم النموذج، وتركز بدلاً من ذلك على "هندسة التقييد والتحكم" (harness engineering).

المنتج الرائد للشركة هو أداة لعلوم البيانات مصممة لاستخراج الرؤى من مجموعات البيانات المعقدة. وبخلاف روبوتات الدردشة القياسية التي تقدم ردودًا حوارية، توفر أداة Probably كل إجابة مع استشهاد محدد ومسار تدقيق شفاف، مما يسمح للمستخدمين بالتحقق من المنطق الكامن وراء كل مخرج.

بنية "البدلة الآلية لعلوم البيانات" (Data Science Mech Suit)

بدلاً من الاعتماد فقط على قدرات الاستنتاج للنماذج الضخمة، تستخدم Probably ما يسميه Elias "البدلة الآلية لعلوم البيانات" (data science mech suit). تعمل هذه البنية كنظام تقييد متطور حيث يتم فحص المخرج الأولي للنموذج اللغوي الكبير فوراً بواسطة مُدقق حتمي.

إذا أنتج النموذج اللغوي الكبير نتيجة لا تتوافق تماماً مع مجموعة البيانات الأساسية، فإن المُدقق يرفضها. والأهم من ذلك، يتم تدريب النموذج اللغوي الكبير خصيصاً لمواجهة هذا المُدقق، مما يخلق نظاماً مغلق الحلقة مُحسناً للسرعة والدقة الواقعية. ويعمل هذا النهج على مبدأ أساسي: من خلال تحسين السياق وتقليل الغموض عبر الهندسة، يمكنك إجبار النموذج على "فعل الشيء الصحيح" دون الحاجة إلى قوة حسابية غاشمة هائلة.

الكفاءة من خلال نماذج أصغر ومحلية

أحد أهم التداعيات التقنية لنهج Probably هو القدرة على استخدام نماذج أصغر وأكثر كفاءة. ولأن "البدلة الآلية" تتولى المهام الشاقة المتمثلة في التحقق وتحسين السياق، يمكن للنظام العمل على نماذج "أضعف بأربع درجات من النماذج الرائدة" (frontier models).

يحقق هذا التحول فوائد اقتصادية وتشغيلية هائلة:

تحدي نموذج الحوافز في مختبرات الذكاء الاصطناعي الكبرى

يشير إلياس إلى وجود خلل هيكلي في المشهد الحالي للذكاء الاصطناعي: حيث يتم تحفيز مختبرات الذكاء الاصطناعي الكبرى لبناء نماذج ضخمة وعامة الأغراض تتطلب تصحيحات متكررة من المستخدمين. وبما أن هذه المختبرات غالباً ما تفرض رسوماً بناءً على استخدام الرموز (tokens)، فإن زيادة الأخطاء والاستعلامات اللاحقة يمكن أن تؤدي في الواقع إلى زيادة الإيرادات. ومن خلال التركيز على الدقة و"تقليل الغموض" عبر الهندسة بدلاً من التوسع، تعمل Probably على حجز مكانة متميزة لتطبيقات الذكاء الاصطناعي ذات المهام الحرجة حيث تكون الموثوقية هي المقياس الوحيد المهم.

النقاط الرئيسية المستفادة