Had Kadar dan Pemutus Litar dalam Sistem AI

Sistem AI teragih adalah kompleks. Ia mengendalikan volum permintaan yang besar dan inferens model yang berat. Anda bergantung kepada kluster GPU, pangkalan data, dan API pihak ketiga. Satu komponen yang bermasalah atau lonjakan trafik boleh menyebabkan keseluruhan sistem anda tergendala.

Anda memerlukan dua alatan untuk melindungi sistem anda: had kadar (rate limiting) dan pemutus litar (circuit breakers).

Had Kadar (Rate Limiting) Had kadar menghalang pengguna atau perkhidmatan tunggal daripada menggunakan terlalu banyak sumber. Ia memastikan akses yang adil untuk semua orang.

Kaedah biasa:

Tip pro untuk AI: Hadkan mengikut jumlah token, bukan sekadar permintaan. Satu prom dengan 4,000 token menggunakan lebih banyak sumber berbanding prom dengan 10 token.

Pemutus Litar (Circuit Breakers) Pemutus litar memantau panggilan ke perkhidmatan seperti pelayan GPU atau pangkalan data vektor anda. Jika sesuatu perkhidmatan gagal terlalu kerap, pemutus litar akan terbuka. Ia menghentikan semua panggilan ke perkhidmatan tersebut dengan serta-merta. Ini dapat mengelakkan kegagalan sistem secara menyeluruh.

Litar tersebut mengikut tiga keadaan:

Amalan terbaik:

Sumber: https://dev.to/biao_lin_14b493a4944b1361/rate-limiting-and-circuit-breakers-in-distributed-ai-systems-1p56

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi