آپ کی ٹیم کو اس ہفتے کسی بہتر AI ماڈل کی ضرورت نہیں ہے
نئے AI ماڈلز کی تلاش بند کریں۔ اصل اپ گریڈ جس کی آپ کو ضرورت ہے وہ آپ کا ورک فلو (workflow) ہے۔
زیادہ تر ٹیمیں اس بات پر توجہ دیتی ہیں کہ کون سا ماڈل زیادہ ذہین محسوس ہوتا ہے۔ وہ نئی ریلیز کا بینچ مارک (benchmark) کرتی ہیں اور ذہانت کے بارے میں بحث کرتی ہیں۔ لیکن اگر آپ LLMs کے ساتھ کام کرتے ہیں، تو آپ اصل تکلیف جانتے ہیں۔ مسئلہ خراب کوڈ کا نہیں ہے۔ مسئلہ خراب عمل درآمد (execution) کا ہے۔
آپ یہ مسائل دیکھتے ہیں:
- ایجنٹ لوپس (Agent loops) جو کسی کام کے دوران آدھے راستے میں رک جاتے ہیں۔
- منظوری کے پرامپٹس (Approval prompts) جو لوگوں کو الجھا دیتے ہیں۔
- کانٹیکسٹ چینز (Context chains) جو دوبارہ کوشش (retries) کے دوران ٹوٹ جاتی ہیں۔
- انسانوں کا صفائی کرنا کیونکہ آٹومیشن اپنی حالت (state) کھو چکی ہوتی ہے۔
ذہانت بڑھ رہی ہے، لیکن آپریشنل کنٹرول پیچھے رہ گیا ہے۔ ہم "آرکیسٹریشن ٹیکس" (orchestration tax) کے دور میں داخل ہو رہے ہیں۔ اگر آپ اس کے لیے منصوبہ بندی نہیں کرتے، تو آپ اسے سسٹم کی خرابیوں (outages) اور خاموش ناکامیوں (silent failures) کی صورت میں ادا کرتے ہیں۔
AI کا آؤٹ پٹ شاذ و نادر ہی حتمی پروڈکٹ ہوتا ہے۔ یہ ایک بڑے سسٹم میں ایک درمیانی مرحلہ ہے۔ آپ کو ان سوالات کو حل کرنا ہوگا:
- کیا ٹائم آؤٹ کے بعد کام دوبارہ شروع ہو سکتا ہے؟
- کیا ہم ہر منظوری کا آڈٹ کر سکتے ہیں؟
- کیا ہم تکرار والے اقدامات کے بغیر مراحل کو دوبارہ چلا سکتے ہیں؟
- کیا کوئی انسان کام کے دوران اس کا کنٹرول سنبھال سکتا ہے؟
سینئر انجینئرز نے یہ مسائل برسوں پہلے ادائیگیوں (payments) اور بیک گراؤنڈ جابز (background jobs) میں حل کر لیے تھے۔ ہم نے idempotency keys، چیک پوائنٹس (checkpoints)، اور ٹرانزیکشن لاگز (transaction logs) کا استعمال کیا۔ AI نے ان مسائل کو ایجاد نہیں کیا۔ اس نے صرف انہیں تیزی سے ہونے کا باعث بنایا ہے۔
اپنا ایگزیکیوشن کنٹریکٹ (execution contract) منتخب کرنے سے پہلے ماڈل کا انتخاب نہ کریں۔ یہ ایسی ہی بات ہے جیسے کسی ایسی کار کے لیے ریسنگ انجن کا انتخاب کرنا جس میں بریک ہی نہ ہوں۔
ان اقدامات کو استعمال کرتے ہوئے ایک قابل اعتماد ورک فلو بنائیں:
AI کے کام کو چھوٹے مراحل میں تقسیم کریں ایک بہت بڑا پرامپٹ استعمال نہ کریں۔ اسے تقسیم کریں: کانٹیکسٹ جمع کریں، تبدیلی کی تجویز دیں، چیک چلائیں، منظوری طلب کریں، اور تبدیلی لاگو کریں۔
پائیدار اسٹوریج (durable storage) کا استعمال کریں اسٹیٹس، مراحل اور کوششوں کی تعداد کو ٹریک کرنے کے لیے ڈیٹا بیس کا استعمال کریں۔ اگر کوئی ورکر کریش ہو جائے، تو آپ اسٹیٹ (state) سے بحالی حاصل کرتے ہیں، میموری سے نہیں۔
Idempotency کو نافذ کریں ڈیٹا کو تبدیل کرنے والے ہر عمل کے لیے ایک مستحکم کی (key) کی ضرورت ہوتی ہے۔ اگر کوئی مرحلہ دو بار چلے، تو نتیجہ وہی رہنا چاہیے۔
درجہ بندی (tiers) کے ساتھ اجازتوں کا انتظام کریں مسلسل منظوری مانگنا بند کریں۔ درجے بنائیں:
- Tier 0: صرف پڑھنے والے کام (خودکار منظوری)۔
- Tier 1: کم خطرے والے لکھنا (بیچ منظوری)۔
- Tier 2: زیادہ اثر والے کام (انسانی چیک پوائنٹ)۔
- آپریشنل میٹرکس کو ٹریک کریں صرف لیٹنسی (latency) اور لاگت پر نظر رکھنا بند کریں۔ ٹائم آؤٹ کی شرح، دوبارہ کوشش کی کامیابی، اور رول بیک (rollback) کی تعدد کو ٹریک کریں۔
بہترین AI ٹیمیں جادوئی پرامپٹس کے بارے میں شیخی نہیں مرحیں گی۔ وہ بورنگ، پائیدار اور قابل مشاہدہ پائپ لائنز چلائیں گی۔ ان کی برتری ماڈل میں نہیں ہے۔ ان کی برتری نظم و ضبط کے حامل سسٹم انجینئرنگ میں ہے۔
Source: https://dev.to/chrisbuildsonline/your-team-doesnt-need-a-better-ai-model-this-week-29l4
Optional learning community: https://t.me/GyaanSetuAi
