قد تجمع 9 ملايين دولار لمكافحة هلوسة النماذج اللغوية الكبيرة (LLM) عبر الهندسة الدقيقة

📅2 hours ago⏱3 min read

In this article

شركة Probably تجمع 9 ملايين دولار لمكافحة هلوسة النماذج اللغوية الكبيرة (LLMs) عبر الهندسة الدقيقة

مع تزايد اندماج النماذج اللغوية الكبيرة (LLMs) في سير العمل المهني، يواجه القطاع عقبة مستمرة: ميل حتى أكثر النماذج تقدمًا إلى الهلوسة. وتواجه الشركة الناشئة Probably هذا التحدي مباشرة، حيث نجحت في تأمين 9 ملايين دولار في جولة تمويل أولي بقيادة Andreessen Horowitz لبناء نهج أكثر صرامة وحتمية لتعزيز موثوقية الذكاء الاصطناعي.

التحرك نحو دقة تصل إلى 99.99%

تتمثل المهمة الأساسية لشركة Probably، بقيادة مؤسسها Peter Elias، في سد الفجوة بين الطبيعة الاحتمالية للنماذج اللغوية الكبيرة ومعيار الدقة البالغ 99.99% المتوقع من الأنظمة الحتمية. ففي البيئات عالية المخاطر، يمكن لخطأ واقعي واحد أن يجعل أداة الذكاء الاصطناعي عديمة الفائدة. ولحل هذه المشكلة، تبتعد Probably عن فكرة أن الدقة هي مجرد نتيجة لحجم النموذج، وتركز بدلاً من ذلك على "هندسة التقييد والتحكم" (harness engineering).

المنتج الرائد للشركة هو أداة لعلوم البيانات مصممة لاستخراج الرؤى من مجموعات البيانات المعقدة. وبخلاف روبوتات الدردشة القياسية التي تقدم ردودًا حوارية، توفر أداة Probably كل إجابة مع استشهاد محدد ومسار تدقيق شفاف، مما يسمح للمستخدمين بالتحقق من المنطق الكامن وراء كل مخرج.

بنية "البدلة الآلية لعلوم البيانات" (Data Science Mech Suit)

بدلاً من الاعتماد فقط على قدرات الاستنتاج للنماذج الضخمة، تستخدم Probably ما يسميه Elias "البدلة الآلية لعلوم البيانات" (data science mech suit). تعمل هذه البنية كنظام تقييد متطور حيث يتم فحص المخرج الأولي للنموذج اللغوي الكبير فوراً بواسطة مُدقق حتمي.

إذا أنتج النموذج اللغوي الكبير نتيجة لا تتوافق تماماً مع مجموعة البيانات الأساسية، فإن المُدقق يرفضها. والأهم من ذلك، يتم تدريب النموذج اللغوي الكبير خصيصاً لمواجهة هذا المُدقق، مما يخلق نظاماً مغلق الحلقة مُحسناً للسرعة والدقة الواقعية. ويعمل هذا النهج على مبدأ أساسي: من خلال تحسين السياق وتقليل الغموض عبر الهندسة، يمكنك إجبار النموذج على "فعل الشيء الصحيح" دون الحاجة إلى قوة حسابية غاشمة هائلة.

الكفاءة من خلال نماذج أصغر ومحلية

أحد أهم التداعيات التقنية لنهج Probably هو القدرة على استخدام نماذج أصغر وأكثر كفاءة. ولأن "البدلة الآلية" تتولى المهام الشاقة المتمثلة في التحقق وتحسين السياق، يمكن للنظام العمل على نماذج "أضعف بأربع درجات من النماذج الرائدة" (frontier models).

يحقق هذا التحول فوائد اقتصادية وتشغيلية هائلة:

تقليل تكاليف الرموز (Tokens): تعمل النماذج الأصغر على خفض تكلفة الاستعلام الواحد بشكل كبير، وهو عامل حيوي مع سعي الشركات لتحسين ميزانيات الذكاء الاصطناعي.
التنفيذ المحلي: يمكن لهذه النماذج الأخف تشغيلها على أجهزة محلية، مثل أجهزة الكمبيوتر المكتبية، بدلاً من الحاجة إلى اتصالات مراكز بيانات مكلفة وعالية التأخير.
القابلية للتوسع: تم تصميم المحرك ليكون قابلاً للتوسع إلى ما وراء علوم البيانات ليشمل قطاعات حساسة للدقة مثل المحاسبة والخدمات الطبية.

تحدي نموذج الحوافز في مختبرات الذكاء الاصطناعي الكبرى

يشير إلياس إلى وجود خلل هيكلي في المشهد الحالي للذكاء الاصطناعي: حيث يتم تحفيز مختبرات الذكاء الاصطناعي الكبرى لبناء نماذج ضخمة وعامة الأغراض تتطلب تصحيحات متكررة من المستخدمين. وبما أن هذه المختبرات غالباً ما تفرض رسوماً بناءً على استخدام الرموز (tokens)، فإن زيادة الأخطاء والاستعلامات اللاحقة يمكن أن تؤدي في الواقع إلى زيادة الإيرادات. ومن خلال التركيز على الدقة و"تقليل الغموض" عبر الهندسة بدلاً من التوسع، تعمل Probably على حجز مكانة متميزة لتطبيقات الذكاء الاصطناعي ذات المهام الحرجة حيث تكون الموثوقية هي المقياس الوحيد المهم.

النقاط الرئيسية المستفادة

التحقق الحتمي (Deterministic Validation): تستخدم Probably بنية "mech suit" للتحقق من مخرجات LLM مقابل مدقق حتمي، بهدف الوصول إلى دقة تبلغ 99.99%.
هندسة فعالة من حيث التكلفة: من خلال تقليل الغموض عبر هندسة سياق أفضل، يمكن للنظام أن يعمل على نماذج أصغر وأرخص بكثير يمكن تشغيلها على أجهزة محلية.
التركيز على الدقة أولاً: تم تصميم هذه التقنية لنقل الذكاء الاصطناعي إلى الصناعات عالية المخاطر والحساسة للدقة مثل الطب والتمويل، حيث لا يمكن قبول الهلوسة (hallucinations).

قد تجمع 9 ملايين دولار لمكافحة هلوسة النماذج اللغوية الكبيرة (LLM) عبر الهندسة الدقيقة

شركة Probably تجمع 9 ملايين دولار لمكافحة هلوسة النماذج اللغوية الكبيرة (LLMs) عبر الهندسة الدقيقة

التحرك نحو دقة تصل إلى 99.99%

بنية "البدلة الآلية لعلوم البيانات" (Data Science Mech Suit)

الكفاءة من خلال نماذج أصغر ومحلية

تحدي نموذج الحوافز في مختبرات الذكاء الاصطناعي الكبرى

النقاط الرئيسية المستفادة

Continue reading

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

اختبارات الفريق الأحمر للذكاء الاصطناعي: تأمين النماذج اللغوية الكبيرة ضد المخاطر العدائية

𝗠𝗔 𝗣𝗿𝗼𝗼𝗳𝗕𝗲𝗻𝗰𝗵: 𝗚𝗣𝗧 𝟱.𝟱 𝗛𝗶𝘁𝘀 𝟭𝟲% 𝗼𝗻 𝗠𝗮𝘁𝗵 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀

نحو تقديم خدمة فعالة لنماذج اللغة الكبيرة (LLM)