گوگل نے AI جنریشن کو ہمیشہ کے لیے بدل دیا
معیاری AI ماڈلز ایک وقت میں ایک لفظ کے حساب سے متن تیار کرتے ہیں۔ یہ طریقہ سست ہے۔ ہر نئے لفظ کے لیے نیٹ ورک کے ذریعے مکمل پاس کی ضرورت ہوتی ہے۔ اس سے کام میں رکاوٹ (bottleneck) پیدا ہوتی ہے۔
Google DeepMind نے اس مسئلے کو حل کرنے کے لیے DiffusionGemma تیار کیا ہے۔ یہ discrete text diffusion کا استعمال کرتا ہے۔ یہ متن کے بڑے بلاکس کو ایک ساتھ بہتر (refine) بنا کر کام کرتا ہے۔
DiffusionGemma کی اہم خصوصیات:
- Parallel Generation: یہ ماڈل متن کے پورے بلاکس کو بیک وقت بہتر بناتا ہے۔ یہ بائیں سے دائیں (left to right) کام نہیں کرتا۔
- 4x تیز رفتار: گوگل کے مطابق GPUs پر اس کی رفتار 4 گنا تک تیز ہے۔
- Mixture of Experts: یہ ماڈل 26B پیرامیٹر بیک بون (backbone) میں سے ہر مرحلے پر 3.8B پیرامیٹرز استعمال کرتا ہے۔
یہ ماڈل encoder-decoder architecture استعمال کرتا ہے۔ یہ ریئل ٹائم میں ایک ڈیجیٹل کینوس پر ٹوکنز (tokens) کی اصلاح کرتا ہے۔
آپ اسے اب استعمال کر سکتے ہیں۔ یہ Apache 2.0 لائسنس کے تحت دستیاب ہے۔ یہ Hugging Face Transformers اور vLLM کے ساتھ کام کرتا ہے۔
کیا diffusion models روایتی AI scaling کی جگہ لے لیں گے؟ یا کیا یہ صرف تیز رفتار جنریشن کی ضروریات کو پورا کریں گے؟ اپنی رائے کا اظہار کریں۔
ماخذ: https://dev.to/incredibleheck/google-just-killed-autoregressive-ai-generation-diffusiongemma-36io
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi