Brain2Qwerty v2 من Meta: سد الفجوة في تقنيات الذكاء الاصطناعي لتحويل إشارات الدماغ إلى نص دون تدخل جراحي
يمثل أحدث إنجاز لشركة Meta في مجال التكنولوجيا العصبية خطوة تقربنا من واجهات الدماغ والحاسوب السلسة دون الحاجة إلى جراحة. ومن خلال الاستفادة من النماذج اللغوية المتقدمة ومجموعات البيانات الضخمة، يوضح نظام Brain2Qwerty v2 كيف يمكن للمستشعرات غير الجراحية ترجمة النشاط العصبي إلى نص متماسك.
التقدم لما وراء الغرسات الجراحية
لسنوات طويلة، تطلبت الاتصالات عالية الدقة من الدماغ إلى النص غرسات جراحية تداخلية لتحقيق معدلات خطأ منخفضة. وبينما تتصدر الأنظمة المزروعة حاليًا بمعدلات خطأ في الكلمات (WER) تقل عن 2%، فإن نهج Meta غير الجراحي باستخدام تخطيط مغناطيسية الدماغ (MEG) يقلص هذه الفجوة بسرعة. فمن خلال قياس المجالات المغناطيسية خارج الجمجمة، يستطيع الباحثون في مختبر الأبحاث الأساسية للذكاء الاصطناعي (FAIR) التابع لشركة Meta التقاط نشاط القشرة الحركية — وهي الإشارات التي تُرسل عندما ينوي الشخص تحريك أصابعه — لإعادة بناء الجمل المكتوبة.
إن حجم هذه الدراسة كبير؛ حيث سجل الباحثون تسعة متطوعين أصحاء لمدة عشر ساعات لكل منهم، مما نتج عنه مجموعة بيانات تضم 22,000 جملة. ويمثل هذا زيادة بمقدار عشرة أضعاف في البيانات مقارنة بالإصدار السابق Brain2Qwerty v1، مما سمح للنموذج بالابتعاد عن الحاجة إلى طوابع زمنية دقيقة لكل ضغطة مفتاح، والتوجه نحو نافذة إشارة مستمرة وغير متزامنة.
قوة دمج النماذج اللغوية الكبيرة (LLM)
يكمن الابتكار الجوهري في Brain2Qwerty v2 في دمج نموذج لغوي مضبوط بدقة، وهو Qwen3، ليعمل بمثابة "مُمهّد" دلالي (semantic smoother). يعالج النظام الإشارات على ثلاثة مستويات متميزة: الحروف، والكلمات، والجمل الكاملة.
تُظهر النتائج مقايضة مثيرة للاهتمام بين دقة الحروف والمعنى الدلالي:
- معدل الخطأ في الكلمات (WER): حقق نموذج v2 متوسط معدل خطأ في الكلمات بنسبة 39%، وهو تحسن هائل مقارنة بنسبة 55% المسجلة في المشفر الخام (raw encoder) ونسبة 43% التي حققها نموذج N-gram في الإصدار v1.
- معدل الخطأ في الحروف (CER): ومن المثير للاهتمام أن معدل الخطأ في الحروف لنموذج v2 بلغ 31%، وهو في الواقع أعلى من المشفر الخام (28%).
يحدث هذا لأن نموذج Qwen3 اللغوي يعطي الأولوية للطلاقة والقواعد النحوية. فإذا كانت الإشارة العصبية مشوشة، يقوم النموذج اللغوي الكبير بـ "الهلوسة" لإنتاج جملة صحيحة نحويًا قد لا تتطابق مع الحروف المقصودة. ومع ذلك، بالنسبة للتطبيقات السريرية، فإن القدرة على إيصال المعنى المقصود (الدقة الدلالية) تعد أكثر أهمية بكثير من الهجاء المثالي لكل حرف على حدة.
تحسين الأبحاث المدفوع بالذكاء الاصطناعي
في نهج مبتكر وشامل، استخدمت Meta ثلاثة وكلاء ذكاء اصطناعي مستقلين يعتمدون على Claude Opus 4.6 لتحسين كود النموذج. وقد نجح هؤلاء الوكلاء في تحديد تقنيات عالية الأداء مثل تنعيم الملصقات (label smoothing) وإسقاط النمط (modality dropout)، متفوقين بذلك على طرق التحسين القياسية التي يصممها البشر. وبينما واجه الوكلاء صعوبات في المهام مفتوحة النهاية واستقرار الكود المعقد، فإن نجاحهم في ضبط المعلمات الفائقة (hyperparameters) يسلط الضوء على عصر جديد يسرع فيه الذكاء الاصطناعي تطوير الأدوات التكنولوجية العصبية.
ومع استكشاف Meta لمستشعرات MEG محمولة تعمل في درجة حرارة الغرفة، يصبح الطريق نحو جهاز اتصال غير جراحي وفي الوقت الفعلي للأفراد الذين يعانون من إعاقات حركية أكثر وضوحًا.
النقاط الرئيسية
- قفزة دلالية: من خلال دمج نموذج Qwen3 اللغوي، نجح Brain2Qwerty v2 في تقليل معدلات الخطأ في الكلمات بشكل كبير إلى 39%، مع إعطاء الأولوية للمعنى على حساب دقة الحروف الخام.
- المعالجة غير المتزامنة: لم يعد النموذج الجديد يتطلب توقيتاً دقيقاً لضغطات المفاتيح، مما يقرب هذه التكنولوجيا من الاستخدام غير الجراحي في الوقت الفعلي.
- نماذج محسنة بالذكاء الاصطناعي: نجحت Meta في توظيف وكلاء يعتمدون على Claude Opus لأتمتة وتحسين عملية تحسين كود فك التشفير العصبي.
