𝗗𝟭 𝗥𝗲𝗮𝗱 𝗥𝗲𝗽𝗹𝗶𝗰𝗮𝘀 𝗛𝗮𝗱 𝟲 𝗦𝗲𝗰𝗼𝗻𝗱𝘀 𝗼𝗳 𝗟𝗮𝗴

📅3 hours ago⏱1 min read

Репліки читання D1 мали затримку у 6 секунд

Репліка читання D1 у Токіо відстала від запису в Північній Америці на 6,1 секунди.

Я дізнався про це завдяки трекеру, який обмежував кількість хибних показів. У документації згадується узгодженість у кінцевому підсумку (eventual consistency). Проте там не вказано конкретний час, на який варто орієнтуватися при плануванні.

Я створив зонд для перевірки застарілості даних (staleness probe), щоб дізнатися реальні цифри. Зонд записує рядок із UUID та epoch. Він опитує репліку, доки рядок не з'явиться, а потім фіксує затримку.

Результати 200 зондів в Азії:

p50: 800 мс
p95: 3 400 мс
p99: 6 100 мс

Затримка є високою, якщо ваш primary знаходиться в Північній Америці, а користувачі — в Азії.

Я також зіткнувся з помилкою схеми. Міграція виконалася на primary. Worker перезапустився. Перші запити потрапили на репліку ще до того, як туди надійшла нова таблиця. Помилка вказувала на те, що таблиця не існує. Таблиця була, але репліка відставала.

Я вирішив це, перенаправляючи запити в обхід затримки. Я не борюся з нею.

Ось мій дизайн:

Записуючий вузол (writer) додає written_at epoch до рядка.
Записуючий вузол додає заголовок X-D1-Written-At до відповіді.
Читаючий вузол (reader) порівнює цей заголовок із даними з репліки.
Якщо дані репліки старіші за заголовок, читаючий вузол перемикається на KV.

KV працює швидше ніж за 500 мс у тому ж регіоні. Він безкоштовний для до 10 млн читань на день. Це забезпечує дешевий спосіб отримання свіжих

𝗗𝟭 𝗥𝗲𝗮𝗱 𝗥𝗲𝗽𝗹𝗶𝗰𝗮𝘀 𝗛𝗮𝗱 𝟲 𝗦𝗲𝗰𝗼𝗻𝗱𝘀 𝗼𝗳 𝗟𝗮𝗴

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗜 𝗦𝘄𝗶𝘁𝗰𝗵𝗲𝗱 𝗧𝗼 𝗥𝘂𝘀𝘁 𝗦𝗼𝗼𝗻𝗲𝗿

𝗥𝗲𝗮𝗰𝘁 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗢𝗽𝘁𝗶𝗺𝗶𝘇𝗮𝘁𝗶𝗼𝗻

𝗔𝘀𝘆𝗻𝗰 𝗦𝗰𝗿𝗮𝗽𝗶𝗻𝗴 𝗜𝘀 𝗕𝗲𝘁𝘁𝗲𝗿 𝗳𝗼𝗿 𝗥𝗔𝗚 𝗜𝗻𝗴𝗲𝘀𝘁𝗶𝗼𝗻

𝟳 𝗛𝗶𝗱𝗱𝗲𝗻 𝗝𝗮𝘃𝗮𝗦𝗰𝗿𝗶𝗽𝘁 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗕𝗼𝘁𝘁𝗹𝗲𝗻𝗲𝗰𝗸𝘀