رازوں کو افشا کیے بغیر AI کا استعمال

آپ کو ایک ایرر (error) کا سامنا کرنا پڑتا ہے۔ آپ اسٹیک ٹریس (stack trace) کاپی کرتے ہیں۔ آپ AI سے اسے ٹھیک کرنے کا کہتے ہیں۔ آپ بھول جاتے ہیں کہ اس ٹیکسٹ میں آپ کا DATABASE_URL اور پاس ورڈ موجود ہے۔ AI چار سیکنڈ میں جواب دے دیتا ہے۔ اب آپ کا راز کسی ریکویسٹ لاگ (request log) یا ٹریننگ سیٹ (training set) میں شامل ہو چکا ہے۔ اب آپ اسے ڈیلیٹ نہیں کر سکتے۔

AI میں رازوں کو پیسٹ کرنا بالکل ایسا ہی ہے جیسے انہیں کسی عوامی ویب سائٹ پر پیسٹ کرنا۔ آپ انہیں واپس نہیں لے سکتے۔

میں کوڈ ڈیلیور کرنے کے لیے روزانہ AI کا استعمال کرتا ہوں۔ میں اس سے بچتا نہیں ہوں۔ میں اسے ایک تھریٹ ماڈل (threat model) کے ساتھ استعمال کرتا ہوں۔

زیادہ تر لوگ سمجھتے ہیں کہ پرامپٹ (prompt) ایک نجی چیٹ ہے۔ ایسا نہیں ہے۔ یہ ایک آؤٹ باؤنڈ ریکویسٹ (outbound request) ہے۔

  • مفت ٹائرز (Free tiers) اکثر ماڈلز کو ٹرین کرنے کے لیے آپ کے ڈیٹا کا استعمال کرتے ہیں۔
  • پیڈ ٹائرز (Paid tiers) عام طور پر آپ کے ڈیٹا پر ٹریننگ نہ کرنے کا وعدہ کرتے ہیں۔
  • پیڈ ٹائرز بھی بدسلوکی کی نشاندہی (abuse detection) اور انسانی جائزے کے لیے لاگز (logs) محفوظ کرتے ہیں۔

ڈیٹا تین طریقوں سے لیک ہوتا ہے:

  • جو آپ پیسٹ کرتے ہیں: کوڈ اسنیپٹس (code snippets)، کنفیگریشنز (configs)، یا ٹریسز (traces)۔
  • جو ٹولز خود بخود منسلک کرتے ہیں: کھلی ہوئی فائلیں، ریپوزٹری کا سیاق و سباق (repo context)، یا ٹرمینل آؤٹ پٹ۔
  • جو ماڈل واپس بھیجتا ہے: PR کی تفصیل یا لاگ میں دہرائے گئے راز۔

AI فراہم کنندہ ایک قابل اعتماد تیسرا فریق ہے۔ آپ ان کے اندرونی پائپ لائنز کا آڈٹ نہیں کر سکتے۔ پرامپٹ باکس کو ایک غیر قابل اعتماد نیٹ ورک کال (untrusted network call) کی طرح سمجھیں۔

ان چیزوں کو بھیجنا بند کریں:

  • لائیو API keys یا ٹوکنز۔
  • .env فائلوں کا مواد۔
  • پرائیویٹ کیز (private keys) یا سرٹیفکیٹس۔
  • اصل صارفین کے نام، ای میلز، یا ادائیگی کا ڈیٹا۔
  • وہ ملکیتی لاجک (proprietary logic) جسے آپ اوپن سورس نہیں کریں گے۔

اس کے بجائے پلیس ہولڈرز (placeholders) استعمال کریں۔ [API_KEY] یا [DB_PASSWORD] استعمال کریں۔ AI ماسک (masks) کے ساتھ بھی اتنی ہی اچھی طرح کام کرتا ہے۔

یہ تین عادتیں اپنائیں:

  • ایک AI ignore فائل استعمال کریں۔ .env اور خفیہ فولڈرز کو ٹول کے سیاق و سباق (context) سے باہر رکھیں۔
  • بھیجنے سے پہلے اسکین کریں۔ پیسٹ کرنے سے پہلے اپنے ٹیکسٹ پر سیکرٹ ڈیٹیکٹر (secret detector) چلائیں۔
  • رازوں کو انکرپٹ (encrypted) رکھیں۔ اگر راز صرف رن ٹائم (runtime) پر میموری میں موجود ہوں، تو آپ انہیں پیسٹ نہیں کر سکتے۔

آپ کے اختیارات کا خلاصہ:

  • مفت/کنزیومر (Free/Consumer): عوامی دستاویزات یا عارضی اسنیپٹس کے لیے استعمال کریں۔
  • پیڈ پرو/ٹیم (Paid Pro/Team): زیادہ تر انجینئرنگ کے کام کے لیے استعمال کریں۔ اس میں معاہداتی تحفظات (contractual protections) موجود ہوتے ہیں۔
  • لوکل/سیلف ہوسٹڈ (Local/Self-hosted): ریگولیٹڈ ڈیٹا کے لیے استعمال کریں جسے آپ کی مشین پر ہی رہنا چاہیے۔

ٹریننگ نہ کرنے کی ضمانت ایک معاہدہ ہے۔ یہ کوئی تکنیکی ڈھال نہیں ہے۔ یہ خطرے کو کم کرتا ہے لیکن اسے ختم نہیں کرتا۔

AI کے آپ کے کوڈ کو چھونے سے پہلے ان اقدامات پر عمل کریں:

  • اپنے AI ٹولز کے لیے ایک ignore فائل شامل کریں۔
  • جو کچھ بھی پیسٹ کریں اسے اسکین کریں۔
  • تمام کریڈنشلز (credentials) کو پلیس ہولڈرز کے ساتھ ماسک کریں۔
  • ملکیتی کام کے لیے پیڈ ٹائرز استعمال کریں۔
  • سیکرٹس کو پلین ٹیکسٹ (plaintext) سے دور رکھنے کے لیے KMS استعمال کریں۔
  • AI کے آؤٹ پٹ کا جائزہ لیں اس سے پہلے کہ وہ آپ کے لاگز یا کمٹس (commits) میں شامل ہو۔

چار سیکنڈ والا جواب اب بھی تیز ہے۔ بس یہ آپ کی سیکیورٹی کی قیمت پر نہیں ہونا چاہیے۔

ماخذ: https://dev.to/faizahmedfarooqui/using-ai-without-leaking-your-secrets-a-threat-model-for-ai-assisted-development-2l57

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi