Meta کا Brain2Qwerty v2: غیر جراحی (non-invasive) دماغ سے متن (brain-to-text) AI میں فرق کو ختم کرنا
نیورو ٹیکنالوجی میں Meta کی تازہ ترین پیش رفت ہمیں بغیر کسی سرجری کے ہموار دماغی کمپیوٹر انٹرفیس (brain-computer interfaces) کے قریب لا رہی ہے۔ جدید زبان کے ماڈلز اور وسیع ڈیٹا سیٹس کا استعمال کرتے ہوئے، Brain2Qwerty v2 سسٹم یہ دکھا رہا ہے کہ کس طرح غیر جراحی سینسرز اعصابی سرگرمیوں کو مربوط متن میں تبدیل کر سکتے ہیں۔
جراحی امپلانٹس سے آگے کی ترقی
برسوں تک، کم غلطی کی شرح حاصل کرنے کے لیے دماغ سے متن تک کی اعلیٰ درستگی والی مواصلات کے لیے جراحی امپلانٹس (invasive surgical implants) کی ضرورت ہوتی تھی۔ اگرچہ اس وقت امپلانٹ شدہ سسٹمز 2% سے کم کے ورڈ ایرر ریٹ (WER) کے ساتھ آگے ہیں، لیکن Magnetoencephalography (MEG) کا استعمال کرتے ہوئے Meta کا غیر جراحی طریقہ کار تیزی سے اس فرق کو کم کر رہا ہے۔ کھوپڑی کے باہر مقناطیسی میدانوں کی پیمائش کر کے، Meta کے Fundamental AI Research (FAIR) لیب کے محققین موٹر کورٹیکس کی سرگرمی—وہ سگنلز جو انسان کے انگلیوں کو حرکت دینے کے ارادے پر بھیجے جاتے ہیں—کو قید کر کے ٹائپ کیے گئے جملوں کو دوبارہ ترتیب دے سکتے ہیں۔
اس مطالعہ کا پیمانہ بہت اہم ہے: محققین نے نو صحت مند رضاکاروں کی دس دس گھنٹوں تک ریکارڈنگ کی، جس کے نتیجے میں 22,000 جملوں کا ڈیٹا سیٹ حاصل ہوا۔ یہ پچھلے Brain2Qwerty v1 کے مقابلے میں ڈیٹا میں دس گنا اضافہ ہے، جس سے ماڈل کو درست کی اسٹروک ٹائم اسٹیمپ (keystroke timestamps) کی ضرورت سے ہٹ کر ایک غیر ہم آہنگ (asynchronous) اور مسلسل سگنل ونڈو کی طرف بڑھنے میں مدد ملی ہے۔
LLM انٹیگریشن کی طاقت
Brain2Qwerty v2 میں بنیادی جدت ایک فائن ٹیون شدہ لینگویج ماڈل، Qwen3، کا انٹیگریشن ہے جو ایک سیمنٹک "سمودر" (semantic smoother) کے طور پر کام کرتا ہے۔ یہ سسٹم تین مختلف سطحوں پر سگنلز پر کارروائی کرتا ہے: حروف، الفاظ، اور مکمل جملے۔
نتائج حروف کی درستگی اور معنوی مفہوم کے درمیان ایک دلچسپ توازن دکھاتے ہیں:
- Word Error Rate (WER): v2 ماڈل نے اوسطاً 39% WER حاصل کیا، جو کہ را (raw) انکوڈر میں دیکھی گئی 55% اور v1 N-gram ماڈل کے ذریعے حاصل کردہ 43% کے مقابلے میں ایک بہت بڑی بہتری ہے۔
- Character Error Rate (CER): دلچسپ بات یہ ہے کہ v2 کے لیے CER 31% تھا، جو کہ درحقیقت را انکوڈر (28%) سے زیادہ تھا۔
ایسا اس لیے ہوتا ہے کیونکہ Qwen3 لینگویج ماڈل روانی اور گرامر کو ترجیح دیتا ہے۔ اگر اعصابی سگنل میں شور (noise) ہو، تو LLM ایک گرامر کے لحاظ سے درست جملہ "ہیلو سینیشن" (hallucinates) کرتا ہے جو شاید مطلوبہ حروف سے مطابقت نہ رکھتا ہو۔ تاہم، طبی استعمال کے لیے، مطلوبہ معنی پہنچانے کی صلاحیت (سیمنٹک درستگی) حروف کے درست ہجے (spelling) سے کہیں زیادہ اہم ہے۔
AI پر مبنی تحقیقی اصلاح (Optimization)
جدت کے ایک میٹا طریقہ کار میں، Meta نے ماڈل کے کوڈ کو بہتر بنانے کے لیے Claude Opus 4.6 پر مبنی تین آزاد AI ایجنٹس کا استعمال کیا۔ ان ایجنٹس نے لیبل اسموتھنگ (label smoothing) اور موڈالٹی ڈراپ آؤٹ (modality dropout) جیسی اعلیٰ کارکردگی والی تکنیکوں کی کامیابی سے نشاندہی کی، جو کہ انسانی ڈیزائن کردہ معیاری اصلاحی طریقوں سے بہتر ثابت ہوئیں۔ اگرچہ ایجنٹس کھلے ہوئے کاموں (open-ended tasks) اور پیچیدہ کوڈ کی استحکام کے ساتھ جدوجہد کرتے رہے، لیکن ہائپر پیرامیٹرز (hyperparameters) کی فائن ٹیوننگ میں ان کی کامیابی ایک نئے دور کی نشاندہی کرتی ہے جہاں AI نیورو ٹیکنالوجیکل ٹولز کی ترقی کو تیز کرتا ہے۔
جیسے جیسے Meta پورٹیبل، کمرے کے درجہ حرارت پر کام کرنے والے MEG سینسرز پر تحقیق کر رہا ہے، موٹر معذوری والے افراد کے لیے ریئل ٹائم، غیر جراحی مواصلاتی آلے کا راستہ تیزی سے واضح ہو رہا ہے۔
اہم نکات
- Semantic Leap: Qwen3 لینگویج ماڈل کو شامل کر کے، Brain2Qwerty v2 نے ورڈ ایرر ریٹ کو نمایاں طور پر کم کر کے 39% کر دیا، جس میں حروف کی خام درستگی کے بجائے معنی کو ترجیح دی گئی۔
- Asynchronous Processing: نیا ماڈل اب مزید درست کی اسٹروک ٹائمنگ کا تقاضا نہیں کرتا، جس سے یہ ٹیکنالوجی ریئل ٹائم، غیر جراحی استعمال کے مزید قریب پہنچ گئی ہے۔
- AI-Optimized Models: Meta نے نیورل ڈی کوڈنگ کوڈ کی اصلاح کو خودکار بنانے اور بہتر بنانے کے لیے Claude Opus پر مبنی ایجنٹس کا کامیابی سے استعمال کیا۔
