D1 ریڈ ریپلیکا میں 6 سیکنڈ کا لیگ تھا

📅3 hours ago⏱1 min read

𝗗𝟭 𝗥𝗲𝗮𝗱 𝗥𝗲𝗽𝗹𝗶𝗰𝗮𝘀 𝗺𝗲𝗶𝗻 𝟲 𝘀𝗲𝗰𝗼𝗻𝗱𝘀 𝗸𝗮 𝗹𝗮𝗴 𝘁𝗵𝗮

ٹوکیو (Tokyo) میں موجود ایک D1 read replica، شمالی امریکہ (North America) میں ہونے والی ایک write سے 6.1 سیکنڈ پیچھے رہ گیا۔

مجھے اس کا علم ایک ٹریکر سے ہوا جو غلط امپریشنز (impressions) کو تھروٹل (throttle) کر رہا تھا۔ ڈاکومنٹیشن میں eventual consistency کا ذکر ہے۔ یہ آپ کو منصوبہ بندی کے لیے کوئی مخصوص وقت نہیں بتاتی۔

میں نے اصل اعداد و شمار معلوم کرنے کے لیے ایک staleness probe بنایا۔ یہ probe ایک UUID اور epoch کے ساتھ ایک row لکھتا ہے۔ یہ تب تک replica کو پول (poll) کرتا رہتا ہے جب تک وہ row ظاہر نہ ہو جائے۔ پھر یہ تاخیر (delay) کو ریکارڈ کرتا ہے۔

ایشیا (Asia) میں 200 probes کے نتائج:

p50: 800ms
p95: 3,400ms
p99: 6,100ms

اگر آپ کا primary شمالی امریکہ میں ہے اور آپ کے صارفین ایشیا میں ہیں، تو لیگ (lag) زیادہ ہوتا ہے۔

مجھے ایک schema error کا بھی سامنا کرنا پڑا۔ primary پر ایک migration رن ہوئی۔ ایک Worker ری اسٹارٹ ہوا۔ پہلی درخواستیں (requests) نئی ٹیبل کے پہنچنے سے پہلے ہی replica پر پہنچ گئیں۔ ایرر (error) یہ تھا کہ ٹیبل موجود نہیں ہے۔ ٹیبل وہاں موجود تھا، لیکن replica پیچھے رہ گیا تھا۔

میں نے اسے لیگ کے گرد راؤٹنگ (routing) کر کے حل کیا۔ میں اس سے لڑتا نہیں ہوں۔

میرا ڈیزائن یہ ہے:

Writer row میں ایک written_at epoch شامل کرتا ہے۔
Writer ریسپانس میں ایک X-D1-Written-At ہیڈر شامل کرتا ہے۔
Reader اس ہیڈر کا موازنہ replica کے ڈیٹا سے کرتا ہے۔
اگر replica کا ڈیٹا ہیڈر سے پرانا ہے، تو reader KV پر فال بیک (fallback) کر جاتا ہے۔

اسی ریجن (region) میں KV 500ms سے کم وقت میں چلتا ہے۔ یہ روزانہ 10M ریڈز تک مفت ہے۔ یہ اہم فلیگز (flags) کے لیے تازہ ڈیٹا حاصل کرنے کا ایک سستا طریقہ فراہم کرتا ہے۔

آپ KV کو صرف اس مختصر وقت کے دوران استعمال کرتے ہیں جب replica پیچھے ہو۔ ایک بار جب replica برابر ہو جاتا ہے، تو زیادہ تر ریڈز معمول کے مطابق D1 پر ہی جاتی ہیں۔

میں نے اپنی تفصیلی پوسٹ میں مکمل اسکرپٹ اور migration pattern شیئر کیا ہے۔

ماخذ (Source): https://dev.to/riversea/d1-read-replicas-returned-stale-data-for-6-seconds-heres-what-i-measured-and-how-i-designed-mme

D1 ریڈ ریپلیکا میں 6 سیکنڈ کا لیگ تھا

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗜 𝗦𝘄𝗶𝘁𝗰𝗵𝗲𝗱 𝗧𝗼 𝗥𝘂𝘀𝘁 𝗦𝗼𝗼𝗻𝗲𝗿

𝗥𝗲𝗮𝗰𝘁 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗢𝗽𝘁𝗶𝗺𝗶𝘇𝗮𝘁𝗶𝗼𝗻

RAG Ingestion کے لیے Async Scraping بہتر ہے

𝟳 𝗛𝗶𝗱𝗱𝗲𝗻 𝗝𝗮𝘃𝗮𝗦𝗰𝗿𝗶𝗽𝘁 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗕𝗼𝘁𝘁𝗹𝗲𝗻𝗲𝗰𝗸𝘀