Twio نے pgvector کے بجائے Vertex AI Search کا انتخاب کیوں کیا؟

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial16 گھنٹے پہلے2min read

𝗪𝗵𝘆 𝗧𝘄𝗶𝗼 𝗖𝗵𝗼𝘀𝗲 𝗩𝗲𝗿𝘁𝗲𝘅 𝗔𝗜 𝗦𝗲𝗮𝗿𝗰𝗵 𝗼𝘃𝗲𝗿 𝗽𝗴𝘃𝗲𝗰𝘁𝗼𝗿

ہم نے Twio میں اپنا پہلا RAG سسٹم pgvector کا استعمال کرتے ہوئے بنایا۔ یہ ایک تیز رفتار انتخاب تھا۔ ہمارا ڈیٹا PostgreSQL میں موجود تھا۔ وہاں embeddings شامل کرنا آسان تھا۔

جیسے جیسے ہم نے وسعت اختیار کی، ہمارا مسئلہ بدل گیا۔ اب ہم یہ نہیں پوچھتے تھے کہ vectors کو کیسے اسٹور کیا جائے۔ ہم یہ پوچھتے تھے کہ ہزاروں بکھرے ہوئے بروکر دستاویزات، ای میلز اور اٹیچمنٹس کو کیسے سمجھا جائے۔

Twio لون بروکرز کو خدمات فراہم کرتا ہے۔ ایک ہی کیس میں شامل ہوتے ہیں: • ای میل تھریڈز • پے سلپس اور بینک اسٹیٹمنٹس • لون فارمز اور لینڈر کے قوانین • ہاتھ سے لکھے ہوئے نوٹس

AI کو اس طرح کے سوالات کے جوابات دینے ہوں گے: • کس ای میل میں گمشدہ ضرورت کا ذکر کیا گیا تھا؟ • کیا یہ بینک اسٹیٹمنٹ آمدنی کی تصدیق کرتی ہے؟ • اس قرض لینے والے کے لیے تمام دستاویزات کا خلاصہ کریں۔

اگر retrieval کمزور ہے، تو جواب بھی کمزور ہوگا۔ اگر parsing غلط ہے، تو ماڈل غلط شواہد دیکھے گا۔ RAG ہمارے پروڈکٹ کی یادداشت ہے۔

pgvector ہمارے پہلے ورژن کے لیے اچھا رہا کیونکہ: • اس کے لیے کسی نئے انفراسٹرکچر کی ضرورت نہیں تھی۔ • اس کی لاگت کم تھی۔ • اس سے SQL debugging آسان تھی۔ • اسے تیزی سے لانچ کیا جا سکتا تھا۔

لیکن pgvector ایک RAG پائپ لائن کا صرف ایک حصہ ہے۔ باقی کام ہمارے ذمے چھوڑ دیا: • اٹیچمنٹس ڈاؤن لوڈ کرنا۔ • OCR کے ذریعے PDFs اور اسکین شدہ دستاویزات سے ٹیکسٹ نکالنا۔ • دستاویزات کو چنکس (chunks) میں تقسیم کرنا اور embeddings تیار کرنا۔ • میٹا ڈیٹا اور retrieval queries ڈیزائن کرنا۔ • indexes اور ranking کو بہتر بنانا۔ • ڈیٹا بیس کے لوڈ کی نگرانی کرنا۔

ایک صاف ستھری PDF آسان ہے۔ ایک اسکین شدہ بینک اسٹیٹمنٹ مشکل ہے۔ پانچ اٹیچمنٹس اور ٹیبلز والی ای میل اس سے بھی زیادہ مشکل ہے۔ pgvector کے ساتھ، ہمیں اس پائپ لائن کی ہر کمزوری کو خود ٹھیک کرنا پڑتا تھا۔

لاگت ہمارے کلاؤڈ بل سے منتقل ہو کر ہمارے انجینئرنگ کے وقت پر آ گئی۔ انجینئرنگ کا وقت ہمارا سب سے محدود ذریعہ تھا۔

موازنہ: • اسکین شدہ دستاویزات: ہم pgvector کے ساتھ OCR بناتے ہیں۔ Vertex زیادہ تر دستاویز پروسیسنگ سنبھالتا ہے۔ • دستاویز سے متعلق سوالات: ہم pgvector کے ساتھ queries اور ranking ڈیزائن کرتے ہیں۔ Vertex مینیجڈ سرچ فراہم کرتا ہے۔ • اٹیچمنٹس کا زیادہ بوجھ: pgvector کے ساتھ Postgres بوجھ اٹھاتا ہے۔ Vertex اس بوجھ کو ہمارے مین ڈیٹا بیس سے باہر رکھتا ہے۔ • لاگت: pgvector کی سروس لاگت کم ہے۔ Vertex کی انجینئرنگ اور دیکھ بھال (maintenance) کی لاگت کم ہے۔

ڈیٹا بیس ایکسٹینشن کے طور پر pgvector سستا ہے۔ پروڈکٹ کے فیصلے کے طور پر Vertex سستا ہے۔

Vertex چار طریقوں سے ہماری مدد کرتا ہے: • مینیج کرنے کے لیے کم انفراسٹرکچر۔ • برقرار رکھنے کے لیے کم دستاویز پروسیسنگ لاجک۔ • Postgres کاروباری لین دین (business transactions) پر مرکوز رہتا ہے۔ • جیسے جیسے ہماری دستاویزات کی مقدار بڑھتی ہے، یہ بھی اس کے ساتھ بڑھتا (scale) ہے۔

Vertex مفت نہیں ہے۔ لیکن اپنا OCR، indexing اور ranking بنانے کی بھی ایک قیمت ہے۔ ہم وہ قیمت انجینئرز کے ہفتوں کی صورت میں ادا کرتے ہیں۔

pgvector کا استعمال کریں اگر: • آپ کے ڈیٹا کی مقدار درمیانی ہے۔ • آپ کی دستاویزات پہلے سے ہی صاف ستھرا ٹیکسٹ ہیں۔ • آپ کو سخت SQL فلٹرنگ کی ضرورت ہے۔ • آپ ایک تیز رفتار اور کم لاگت والا پہلا ورژن چاہتے ہیں۔

ہمارا سبق سادہ ہے: اس ٹول سے شروع کریں جو آپ کو تیزی سے سیکھنے میں مدد دے۔ پھر اس ٹول پر منتقل ہو جائیں جو آپ کو بہترین طریقے سے کام کرنے میں مدد دے۔

ماخذ: https://dev.to/twio_ai/why-twio-chose-vertex-ai-search-over-pgvector-for-production-rag-51jm

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi

Twio نے pgvector کے بجائے Vertex AI Search کا انتخاب کیوں کیا؟

Continue reading

ویکٹر ٹیبلز 101: ویکٹر اور PGVector کو سمجھنا

RAG کے ذریعے بہتر AI کی تعمیر

پروڈکشن اے آئی کے لیے ویکٹر سرچ کافی نہیں ہے

2026 میں ویکٹر ڈیٹا بیس کا انتخاب

ویکٹر ڈیٹا بیس کیا ہے؟