10x قیمتوں کا گرنا ایک آرکیٹیکچر پر مبنی فیصلہ ہے

انجینئرز چند ٹوکنز بچانے کے لیے پرامپٹس (prompts) کو دوبارہ لکھنے میں گھنٹوں صرف کرتے ہیں۔ یہ کوشش اکثر ضائع ہو جاتی ہے۔

ٹوکنز مفت نہیں ہیں، لیکن AI کی قیمت بہت تیزی سے گر رہی ہے۔ AI کی کارکردگی کے ایک مخصوص لیول کی قیمت ہر سال تقریباً 10x کم ہو جاتی ہے۔ اسے LLMflation کہا جاتا ہے۔

ڈیٹا ظاہر کرتا ہے کہ یہ رجحان حقیقت پر مبنی ہے:

  • 2021 میں GPT-3 لیول کی کوالٹی کی قیمت 60 ڈالر فی ملین ٹوکنز تھی۔
  • اب Llama 3.2 3B استعمال کرتے ہوئے اس کی قیمت تقریباً 0.06 ڈالر ہے۔
  • یہ تین سالوں میں 1,000x کمی ہے۔
  • GPT-3.5 کوالٹی کی قیمتیں صرف 18 مہینوں میں 280x گر گئیں۔

فرنٹیر ماڈلز (frontier models) مہنگے رہتے ہیں۔ لیکن وہ ماڈلز جو آپ عام کاموں کے لیے استعمال کرتے ہیں، ان کی قیمتیں تیزی سے گر رہی ہیں۔ اگر آپ آج کی قیمتوں کے مطابق خود کو ڈھالتے ہیں، تو آپ ایک ایسی رقم کے لیے کام کر رہے ہیں جو چند مہینوں میں ختم ہو جائے گی۔

پرامپٹ ٹرکس (prompt tricks) پر توجہ نہ دیں۔ آرکیٹیکچر پر توجہ دیں۔

جیتنے کے لیے ان تین اصولوں پر عمل کریں:

• ماڈل کو ایک جز (component) کے طور پر سمجھیں۔ ان پٹ اور آؤٹ پٹ کے لیے ایک ہی انٹرفیس استعمال کریں۔ اپنے ایپ میں مخصوص ماڈلز کو ہارڈ کوڈ (hard-code) نہ کریں۔ اس سے آپ ایک سادہ کنفیگ (config) تبدیلی کے ذریعے ماڈلز کو تبدیل کر سکیں گے۔

• سب سے پہلے ایویلیوایشن ہارنس (evaluation harness) بنائیں۔ آپ کو یہ ثابت کرنے کے لیے ایک ٹیسٹ سیٹ کی ضرورت ہے کہ آیا ایک نیا اور سستا ماڈل پرانے ماڈل کی طرح کام کرتا ہے یا نہیں۔ ٹیسٹ کے بغیر، آپ مہنگے ماڈلز پر ہی پھنسے رہیں گے کیونکہ آپ کو چیزیں خراب ہونے کا ڈر ہوگا۔

• ان چیزوں میں سرمایہ کاری کریں جن کی قیمتیں کم نہیں ہوتیں۔ آپ کے ڈیٹا کا معیار، آپ کے ریٹریول سسٹم (retrieval systems)، آپ کے گارڈ ریلز (guardrails) اور آپ کا یوزر ایکسپیرینس (user experience) سالانہ 10x کم نہیں ہوتے۔ صرف ماڈل کی قیمت کم ہوتی ہے۔

محض خام صلاحیت (raw capability) کے لیے فائن ٹیوننگ (fine-tuning) کرنا بند کریں۔ فائن ٹیوننگ اس بدلتے ہوئے رجحان کے خلاف ایک داؤ ہے۔ آپ اپنے ڈیٹا اور انفراسٹرکچر کو ایک مخصوص ماڈل کے ساتھ جکڑ دیتے ہیں۔ جب ایک نیا بیس ماڈل (base model) آتا ہے، تو آپ کا فائن ٹیون شدہ ماڈل ایک مہنگا اور پرانا ڈھانچہ بن کر رہ جاتا ہے۔ صرف ان چیزوں کے لیے فائن ٹیون کریں جو تبدیل نہیں ہوتیں، جیسے کہ آپ کے برانڈ کا مخصوص لہجہ یا منفرد ڈیٹا فارمیٹس۔

جیتنے والی حکمت عملی ایک ایسا سسٹم بنانا ہے جو ماڈلز کی تبدیلی کو انتہائی آسان بنا دے۔ ٹوکنز گننا بند کریں۔ اپنے پروڈکٹ کو اس طرح ڈیزائن کریں کہ وہ قیمتوں کے گرتے ہوئے رجحان کا فائدہ اٹھا سکے۔

Source: https://dev.to/aiexplore369zoho/the-10x-a-year-price-collapse-is-an-architecture-bet-not-a-prompt-trick-49df

Optional learning community: https://t.me/GyaanSetuAi