𝗥𝗮𝘁𝗲 𝗟𝗶𝗺𝗶𝘁𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗶𝗿𝗰𝘂𝗶𝘁 𝗕𝗿𝗲𝗮𝗸𝗲𝗿𝘀 𝗶𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀 -> AI Sistemlerinde Hız Sınırlama (Rate Limiting) ve Devre Kesiciler (Circuit Breakers)

Dağıtık AI sistemleri karmaşıktır. Devasa istek hacimlerini ve ağır model çıkarımlarını (inference) yönetirler. GPU kümelerine, veri tabanlarına ve üçüncü taraf API'lere güvenirsiniz. Tek bir hatalı bileşen veya ani bir trafik artışı tüm sisteminizin çökmesine neden olabilir.

Sisteminizi korumak için iki araca ihtiyacınız vardır: hız sınırlama (rate limiting) ve devre kesiciler (circuit breakers).

Hız Sınırlama (Rate Limiting) Hız sınırlama, tek bir kullanıcının veya servisin çok fazla kaynak kullanmasını engeller. Herkes için adil erişim sağlar.

Yaygın yöntemler:

AI için ipucu: Sadece istek sayısına göre değil, token sayısına göre sınırlama yapın. 4.000 token içeren tek bir istem (prompt), 10 token içeren bir istemden daha fazla kaynak tüketir.

Devre Kesiciler (Circuit Breakers) Bir devre kesici, GPU sunucunuz veya vektör veri tabanınız gibi servislere yapılan çağrıları izler. Eğer bir servis çok fazla kez hata verirse, devre kesici açılır (opens). O servise yapılan tüm çağrıları anında durdurur. Bu, sistemin tamamen çökmesini engeller.

Devre üç durumu takip eder:

En iyi uygulamalar:

Kaynak: https://dev.to/biao_lin_14b493a4944b1361/rate-limiting-and-circuit-breakers-in-distributed-ai-systems-1p56

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi