بڑے دستاویزات کی تلاش کے لیے Claude Code کو تیز کیسے بنایا جائے
Claude Code دس فائلوں کے ساتھ بہتر کام کرتا ہے۔ سینکڑوں PDFs کے ساتھ یہ سست ہو جاتا ہے۔
جب فائلوں کی تعداد بڑھتی ہے، تو آپ کو تین مسائل کا سامنا کرنا پڑتا ہے:
- رفتار کم ہو جاتی ہے کیونکہ ماڈل بہت زیادہ متن پڑھتا ہے۔
- اخراجات بڑھ جاتے ہیں کیونکہ آپ کو ہر اسکین شدہ ٹوکن کے لیے ادائیگی کرنی پڑتی ہے۔
- درستگی کم ہو جاتی ہے کیونکہ جواب نہ ملنے کی صورت میں ماڈل اندازہ لگانے کی کوشش کر سکتا ہے۔
مسئلہ ماڈل کا نہیں ہے۔ مسئلہ تلاش کی حکمت عملی (search strategy) کا ہے۔
ڈیفالٹ کے طور پر، Claude Code فائلوں کو براہ راست پڑھتا ہے۔ یہ جواب تلاش کرنے کے لیے ہر چیز کو اسکین کرتا ہے۔ یہ آپ کے سوال کی دشواری کے بجائے آپ کی لائبریری کے سائز کے مطابق بڑھتا چلا جاتا ہے۔
اس کا حل Retrieval Augmented Generation (RAG) ہے۔
ایک بڑے کام کے بجائے، آپ کام کو تقسیم کر دیتے ہیں: • ایک retrieval layer پہلے سے بنے ہوئے انڈیکس (index) میں تلاش کرتی ہے۔ • یہ ان مخصوص اقتباسات کو تلاش کرتی ہے جن میں جواب موجود ہوتا ہے۔ • یہ Claude Code کو صرف وہی چھوٹے حصے فراہم کرتی ہے۔
اس سے کام کی رفتار مستقل رہتی ہے۔ چاہے آپ کے پاس پچاس فائلیں ہوں یا پچاس ہزار، Claude صرف متن کا ایک چھوٹا سا حصہ پڑھتا ہے۔
آپ اسے Model Context Protocol (MCP) کا استعمال کرتے ہوئے Claude Code سے جوڑ سکتے ہیں۔ ایک MCP server ایک ایسے ٹول کے طور پر کام کرتا ہے جسے Claude درست ڈیٹا حاصل کرنے کے لیے کال کرتا ہے۔
نتائج نمایاں ہیں۔ 500 PDFs پر کیے گئے ایک ٹیسٹ سے پتہ چلا کہ RAG layer کے استعمال نے عمل کو: • 4.2x تیز بنا دیا۔ • 3.2x سستا بنا دیا۔ • زیادہ قابل اعتماد بنا دیا۔
جب براہ راست فائل سرچ استعمال کریں:
- آپ کی فائلیں کم ہوں (کئی درجن سے کم)۔
- فائلیں ہر منٹ میں تبدیل ہوتی ہوں۔
- آپ کو فوری اور ابتدائی تحقیق والے کام کی ضرورت ہو۔
جب RAG layer استعمال کریں:
- آپ کا دستاویزات کا مجموعہ بڑا ہے یا بڑھ رہا ہے۔
- آپ اکثر ایک ہی نالج بیس (knowledge base) سے سوالات کرتے ہیں۔
- لاگت اور درستگی آپ کی ترجیحات ہیں۔
اسے نافذ کرنے کے لیے:
- اپنے دستاویزات کا پہلے سے انڈیکس بنا لیں۔
- معنی کو برقرار رکھنے کے لیے semantic chunking کا استعمال کریں۔
- MCP server کے ذریعے انڈیکس کو فراہم کریں۔
- Claude کو بتائیں کہ وہ صرف حاصل کردہ ٹکڑوں (chunks) کو استعمال کرتے ہوئے ہی جواب دے۔
آرکیٹیکچر آپ کی رفتار کا تعین کرتا ہے۔ چھوٹے کاموں کے لیے براہ راست سرچ استعمال کریں۔ بڑے پیمانے کے کاموں کے لیے RAG استعمال کریں۔
Optional learning community: https://t.me/GyaanSetuAi
