𝗠𝗖𝗣 𝗗𝗶𝗿𝘁𝘆 𝗦𝗲𝗰𝗿𝗲𝘁: 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

📅1 hour ago⏱2 min read

𝗠𝗖𝗣 کا گندہ راز: آپ کا ایجنٹ ٹوکنز ضائع کر رہا ہے

آپ کا AI ایجنٹ ہر بار جب کسی MCP سرور کو کال کرتا ہے، تو ایک چھپا ہوا ٹیکس ادا کرتا ہے۔ یہ ٹیکس ڈالرز میں نہیں ہے، بلکہ ٹوکنز کی صورت میں ہے۔

اگر آپ بڑے پیمانے پر ایجنٹس چلاتے ہیں، تو یہ لاگت تیزی سے بڑھتی ہے۔ میں نے اپنے ٹوکن کے استعمال پر نظر رکھی اور اس میں بہت زیادہ اضافہ دیکھا۔ مسئلہ ماڈل کی منطق (reasoning) کا نہیں ہے۔ مسئلہ context overhead کا ہے۔

جب آپ کسی ایجنٹ کو MCP سرور سے جوڑتے ہیں، تو سرور system prompt میں tool definitions بھیجتا ہے۔ ان میں ہر پیرامیٹر اور تفصیل شامل ہوتی ہے۔

اگر آپ 20 ٹولز والے پانچ MCP سرورز استعمال کرتے ہیں، تو آپ ہر ایک مرحلے (turn) میں 15,000 تک ٹوکنز کا اضافہ کر دیتے ہیں۔ یہ اس سے پہلے ہوتا ہے کہ ماڈل کچھ بولے بھی۔

یہاں 10 مرحلوں کے مکالمے کے ٹیسٹ کا ڈیٹا ہے:

• بغیر MCP کے: 2,400 ٹوکنز فی مرحلہ • 3 MCP سرورز: 18,700 ٹوکنز فی مرحلہ • 5 MCP servers: 31,200 ٹوکنز فی مرحلہ

موجودہ قیمتوں کے مطابق، 5 سرورز کے ساتھ روزانہ 50 مکالمے چلانے والی ٹیم صرف MCP overhead پر ماہانہ $23,400 خرچ کر سکتی ہے۔

اس سے دو اہم مسائل پیدا ہوتے ہیں:

معیار میں کمی آتی ہے۔ جب tool schemas آپ کے context window کا 40% حصہ لے لیتی ہیں، تو ماڈل کے پاس ہسٹری کے لیے کم جگہ بچتی ہے۔ جگہ ختم ہونے کی وجہ سے ماڈل چیزیں بھولنا شروع کر دیتا ہے۔
لاگت مقررہ ہوتی ہے۔ آپ ہر ایک مرحلے پر ان system prompts کے لیے پوری قیمت ادا کرتے ہیں۔

اسے ٹھیک کرنے کے تین طریقے یہ ہیں:

Use a Gateway تمام tool definitions ایک ساتھ لوڈ نہ کریں۔ صرف موجودہ کام کے لیے ضروری ٹولز شامل کرنے کے لیے ایک gateway کا استعمال کریں۔ اس سے overhead فی کال 8,000 ٹوکنز سے کم ہو کر 400 ٹوکنز تک گر سکتا ہے۔
Use an Intent Classifier یہ فیصلہ کرنے کے لیے کہ کون سا سرور متعلقہ ہے، پہلے ایک سستا ماڈل کال چلائیں۔ ایک classifier پر ہونے والی معمولی لاگت آپ کے MCP overhead کو 60% سے 80% تک کم کر سکتی ہے۔
Compress Your Schemas MCP schemas بہت زیادہ الفاظ استعمال کرتی ہیں۔ تفصیلات کو صرف ضروری اسموں (nouns) تک محدود کر دیں۔ example fields کو ہٹا دیں۔ میں نے پایا کہ اگر آپ متن کو سادہ کر دیں تو 400-token schema 120 tokens پر بھی بہترین کام کرتی ہے۔

Context کو لامحدود سمجھنا بند کریں۔ Context budget ایک انفراسٹرکچر ہے۔ اسے ایک حقیقی لاگت کی طرح مینیج کریں۔

آپ اپنے پروڈکشن ایجنٹس میں MCP overhead کو کیسے سنبھالتے ہیں؟ مجھے کمنٹس میں بتائیں۔

Source: https://dev.to/mrclaw207/mcps-dirty-secret-your-agent-is-burning-10-32x-more-tokens-than-you-think-32d1

Optional learning community: https://t.me/GyaanSetuAi

𝗠𝗖𝗣 𝗗𝗶𝗿𝘁𝘆 𝗦𝗲𝗰𝗿𝗲𝘁: 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

Continue reading

𝗠𝗖𝗣 𝘃𝘀 𝗖𝗟𝗜: 𝗠𝗖𝗣 𝗨𝘀𝗲𝘀 𝟭𝟳𝘅 𝗠𝗼𝗿𝗲 𝗧𝗼𝗸𝗲𝗻𝘀

MCP سرورز AI ایجنٹس کو پروڈکشن میں مفید بناتے ہیں

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗚𝗮𝘁𝗲𝘄𝗮𝘆 𝗣𝗮𝘁𝘁𝗲𝗿𝗻: 𝗠𝗮𝗻𝗮𝗴𝗶𝗻𝗴 𝟭𝟯,𝟬𝟬𝟬+ 𝗦𝗲𝗿𝘃𝗲𝗿𝘀

𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗠𝗼𝗱𝗲𝗹 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗣𝗿𝗼𝘁𝗼𝗰𝗼𝗹

ایم سی پی کانٹیکسٹ ٹیکس