ورثے کی زبانوں کے لیے رازداری کا تحفظ کرنے والا AI
AI کی تحقیق اکثر ڈیٹا کے انسانی پہلو کو نظر انداز کر دیتی ہے۔
میں ایک بار شمالی ناروے کی ایک لائبریری میں بیٹھا تھا۔ میں ہاتھ سے لکھی ہوئی سامی (Sámi) جملوں کا مطالعہ کر رہا تھا۔ ایک مقامی بزرگ نے مجھے ایسے الفاظ سکھائے جن کا انگریزی میں کوئی متبادل نہیں ہے۔ یہ الفاظ برف، رینڈیر (reindeer) اور ہوا کی وضاحت کرتے ہیں۔
بزرگ نے مجھ سے ایک مشکل سوال پوچھا: "کیا آپ کی مشینیں ہماری زبان کو ہم سے چھینے بغیر اسے زندہ رکھنے میں ہماری مدد کر سکتی ہیں؟"
اس سوال نے میری تحقیق کا رخ بدل دیا۔
زیادہ تر AI ٹریننگ کے لیے ڈیٹا کی بہت بڑی مقدار کی ضرورت ہوتی ہے۔ زیادہ تر ڈیٹا مرکزی سرورز پر جاتا ہے۔ مقامی برادریوں کے لیے، لسانی ڈیٹا مقدس ہوتا ہے۔ یہ نجی ہوتا ہے۔ مقدس ترانوں یا خاندانی لوریوں کی اصل آڈیو کو کلاؤڈ سرور پر بھیجنا کوئی آپشن نہیں ہے۔
میں نے اسے حل کرنے کے لیے ایک نیا فریم ورک تیار کیا۔ یہ رازداری کو برقرار رکھنے والی ایکٹو لرننگ (privacy-preserving active learning) کو انورس سیمولیشن ویریفیکیشن (inverse simulation verification) کے ساتھ جوڑتا ہے۔
یہ اس طرح کام کرتا ہے:
- مقامی آلات: برادریاں اپنی اصل آڈیو اور متن اپنے اپنے آلات پر رکھتی ہیں۔
- رازداری کی تہہ: سسٹم ڈیٹا میں ریاضیاتی شور (mathematical noise) شامل کرتا ہے۔ یہ بولنے والوں کی شناخت اور سیاق و سباق کا تحفظ کرتا ہے۔
- شماریاتی خلاصے: اصل آڈیو کے بجائے، سسٹم صرف تجریدی نمونے (abstract patterns) بھیجتا ہے، جیسے کہ آوازیں ایک دوسرے کے بعد کس طرح آتی ہیں۔
- انورس سیمولیشن: ایک سرور ان نمونوں کو استعمال کرتے ہوئے ایک مصنوعی ڈیٹا سیٹ (synthetic dataset) تیار کرتا ہے۔ یہ ڈیٹا سیٹ اصل ریکارڈنگز کا استعمال کیے بغیر اصل زبان کے ڈھانچے کی عکاسی کرتا ہے۔
- ایکٹو لرننگ: ماڈل اس بات کی شناخت کرتا ہے کہ اسے زبان کے کن مخصوص حصوں کے بارے میں مزید سیکھنے کی ضرورت ہے۔ یہ برادری سے صرف ان مخصوص حصوں کے لیے مدد مانگتا ہے۔
میں نے سویڈن میں ایک سامی گروپ کے ساتھ اس کا تجربہ کیا۔ ان کے پاس 120 گھنٹے کی آڈیو تھی۔ وہ اپنے بچوں کے لیے speech-to-text سسٹم چاہتے تھے۔
ہم نے سسٹم کو ایک سادہ Raspberry Pi پر چلایا۔ کوئی بھی اصل آڈیو ان کے کمیونٹی سینٹر سے باہر نہیں گئی۔ ٹریننگ کے 10 چکروں کے بعد، ماڈل نے 78% word error rate حاصل کیا۔ یہ ایک چھوٹے ڈیٹا سیٹ کے لیے ایک بہت بڑی کامیابی ہے۔
اس کام سے حاصل ہونے والے اہم اسباق:
- رازداری اور افادیت کو آپس میں لڑنے کی ضرورت نہیں ہے۔ انورس سیمولیشن دونوں کی اجازت دیتی ہے۔
- نایاب زبانوں کے لیے بڑے ماڈلز کے مقابلے میں چھوٹے اور ذہین ماڈلز بہتر کام کرتے ہیں۔
- تکنیکی آلات کو کام کرنے کے لیے ثقافتی اصولوں کا احترام کرنا چاہیے۔
AI کو ثقافتی خودمختاری کی خدمت کرنی چاہیے۔ ہمیں ایسے ٹولز بنانے چاہئیں جو برادریوں کو اپنے ڈیٹا پر کنٹرول کرنے دیں۔
اختیاری سیکھنے کی کمیونٹی: https://t.me/GyaanSetuAi