مارگریٹ ایٹووڈ کی وارننگ: اے آئی (AI) اب بھی "گھٹیا ان پٹ، گھٹیا آؤٹ پٹ" کے چکر میں کیوں پھنسی ہوئی ہے

معروف مصنفہ مارگریٹ ایٹووڈ نے حال ہی میں لارج لینگویج ماڈلز (LLMs) پر ایک دو ٹوک تنقید کی ہے، جس میں انہوں نے درستگی اور ڈیٹا کی سالمیت کے حوالے سے جاری جدوجہد کو اجاگر کیا ہے۔ ان کا تجربہ موجودہ اے آئی (AI) کے دور کی ایک بنیادی حقیقت کی نشاندہی کرتا ہے: یہاں تک کہ جدید ترین ماڈلز بھی اپنے تربیتی ڈیٹا (training data) کے معیار تک محدود ہیں۔

کلود (Claude) کا تجربہ: ہالوسینیشن (Hallucinations) سے ایک سبق

پرتگال کے شہر پورٹو میں بابیل لٹریری اینڈ کلچرل فیسٹیول سے خطاب کرتے ہوئے، Handmaid’s Tale کی مصنفہ نے Anthropic کے Claude کو استعمال کرنے کے اپنے ایک تجربے کا انکشاف کیا۔ ایٹووڈ کی جانب سے برطانوی جاسوسی سیریز Father Brown کے بارے میں معلومات حاصل کرنے کے لیے چیٹ بوٹ کے استعمال کی کوشش ناکام رہی، جو "ہالوسینیشن" (hallucination) کے تصور کی بہترین مثال ہے۔

ایٹووڈ کے مطابق، ماڈل نے غلط معلومات فراہم کیں، جو عملی طور پر صارف سے "جھوٹ" بولنے کے مترادف تھا۔ انہوں نے نوٹ کیا کہ LLM نے غالباً ٹیلی ویژن کے ریویوز کی ایک بڑی مقدار کا جائزہ لیا ہوگا، لیکن چونکہ آن لائن تنقید میں عام طور پر کہانی کے اہم موڑ (spoilers) سے پرہیز کیا جاتا ہے، اس لیے ماڈل اپنے تربیتی ڈیٹا کے پیٹرنز کی وجہ سے گمراہ ہو گیا۔ یہ تکنیکی باریکی ڈویلپرز کے لیے ایک بنیادی چیلنج کو اجاگر کرتی ہے: LLMs دراصل امکانی انجن (probabilistic engines) ہیں جو حقائق کی تصدیق کے بجائے پیٹرن میچنگ کو ترجیح دیتے ہیں، جس کے نتیجے میں اکثر پراعتماد لیکن غلط نتائج سامنے آتے ہیں۔

ڈیٹا کا المیہ: گھٹیا ان پٹ، گھٹیا آؤٹ پٹ (Garbage In, Garbage Out)

ایٹووڈ کی تنقید کمپیوٹنگ کے ایک لازوال اصول پر مرکوز ہے: "گھٹیا ان پٹ، گھٹیا آؤٹ پٹ" (garbage in, garbage out)۔ انہوں نے نشاندہی کی کہ LLMs کو اسکریپ شدہ (scraped)، پہلے سے شائع شدہ اور ممکنہ طور پر پرانی معلومات پر تربیت دی جاتی ہے۔ جب کسی ماڈل کو ایسا ڈیٹا دیا جاتا ہے جو نامکمل، متعصب یا منطقی طور پر غیر مستقل ہو، تو اس کا نتیجہ لازمی طور پر ان خامیوں کی عکاسی کرے گا۔

وسیع تر اے آئی (AI) کے منظر نامے کے لیے، یہ ایک یاد دہانی ہے کہ ماڈل پیرامیٹرز کو بڑھانا ڈیٹا کے معیار کا متبادل نہیں ہے۔ جیسے جیسے ڈویلپرز استدلال کی صلاحیتوں کو بڑھانے کے لیے بڑے ڈیٹا سیٹس پر زور دے رہے ہیں، ان ڈیٹا سیٹس کے اندر موجود "شور" (noise)—جیسے کہ ایٹووڈ کی ذکر کردہ ریویوز میں کہانی کے اہم موڑ (spoilers) کی کمی—ایسی نظامی غلطیاں (systematic errors) پیدا کر سکتا ہے جنہیں Claude جیسے جدید ترین ڈھانچے (architectures) بھی آسانی سے دور نہیں کر سکتے۔

اخلاقی تشویش: موقع پرستی بمقابلہ تخلیقی صلاحیت

تکنیکی حدود سے ہٹ کر، ایٹووڈ نے اے آئی (AI) کے استعمال کے انسانی پہلو پر بھی بات کی۔ انہوں نے ان لوگوں کو "موقع پرست" قرار دیا جو حقیقی تخلیق یا تحقیق کی سختیوں سے بچنے کے لیے اے آئی پر بہت زیادہ انحصار کرتے ہیں۔ انہوں نے خبردار کیا کہ ناقابلِ شناخت اے آئی سے تیار کردہ مواد کا استعمال کرتے ہوئے "دھوکہ دہی" کا لالچ ان صنعتوں کے لیے ایک بڑھتا ہوا خدشہ ہے جو انسانی ذہانت اور باریکیوں پر انحصار کرتی ہیں۔

بانیوں اور ٹیک پروفیشنلز کے لیے یہ فرق انتہائی اہم ہے۔ اگرچہ اے آئی (AI) ایک طاقتور پیداواری ٹول کے طور پر کام کر سکتا ہے، لیکن ایٹووڈ کا یہ مشاہدہ کہ "ایسے لوگ بھی جو اسے کاروباری مقاصد کے لیے استعمال کرتے ہیں، انہیں اسے چیک کرنا پڑتا ہے" اس بات پر زور دیتا ہے کہ انسانی نگرانی اے آئی ورک فلو کا ایک ناگزیر حصہ ہے۔ مکمل طور پر خود مختار اور غلطیوں سے پاک اے آئی کا دور ابھی ایک دور کا خواب ہے، اور سچائی کی ذمہ داری صارف پر ہی عائد ہوتی ہے۔

اہم نکات

  • ڈیٹا کی سالمیت اولین ترجیح ہے: "گھٹیا ان پٹ، گھٹیا آؤٹ پٹ" کا اصول LLMs کے لیے سب سے بڑی رکاوٹ بنا ہوا ہے، کیونکہ ماڈلز اپنی تربیتی ڈیٹا کے معیار اور تکمیل سے محدود ہوتے ہیں۔
  • ہالوسینیشن کا جال: Anthropic کے Claude جیسے جدید ماڈلز بھی سادہ حقائق کی معلومات فراہم کرنے میں ناکام ہو سکتے ہیں اگر ان کے تربیتی ڈیٹا میں موجود بنیادی پیٹرنز گمراہ کن ہوں۔
  • انسانی نگرانی کی ضرورت: اے آئی (AI) کو انسانی مہارت اور تنقیدی سوچ کے متبادل کے بجائے ایک ایسے ٹول کے طور پر دیکھا جانا چاہیے جس کے لیے مسلسل تصدیق کی ضرورت ہو۔