𝗧𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝘄𝗶𝘁𝗵 𝗦𝗦𝗘

Translated for your language. Read the original.

AI-assisted draft.

3 jam lalu1min read

Mengawal Latensi AI dengan SSE

Saya membina ciri melengkapkan automatik (autocomplete) AI. Pengguna tidak menyukainya.

Setiap tekanan kekunci menghantar permintaan ke model AI. Pengguna menunggu selama 2 hingga 3 saat untuk respons penuh. UI terasa rosak.

Saya cuba debouncing. Saya cuba caching. Saya cuba menggunakan loading spinners. Tiada apa yang berjaya. Masalah teras tetap sama. Pengguna perlu menunggu jawapan lengkap sebelum dapat melihat sebarang data.

Saya menyelesaikannya menggunakan Server-Sent Events (SSE) untuk melakukan penstriman (streaming) respons secara berperingkat (chunk by chunk).

Aliran perlahan yang asal:

Pengguna menaip aksara
300ms debounce
Permintaan HTTP POST
Pelayan memanggil API AI (1-2 saat)
Pelayan mengembalikan respons penuh
Klien memaparkan (renders)

Pengguna tidak melihat apa-apa selama 2 saat.

Saya mempertimbangkan polling, tetapi ia menambah terlalu banyak beban (overhead). WebSockets berfungsi, tetapi ia terlalu berat untuk penstriman satu hala.

Saya memilih SSE. Ia adalah satu piawaian di mana pelayan menghantar acara teks melalui satu sambungan yang panjang.

Mengapa SSE berkesan untuk AI:

Ia adalah satu hala (pelayan ke klien)
Ia menggunakan cebisan (chunks) JSON berasaskan teks
Ia mengendalikan penyambungan semula secara automatik
Anda tidak memerlukan perpustakaan (libraries) tambahan

Keputusannya adalah serta-merta. Perkataan pertama muncul dalam masa kurang daripada 300ms. Pengguna melihat cadangan dibina huruf demi huruf.

Metrik saya bertambah baik:

Masa untuk respons visual pertama: 2.1s kepada 0.3s
Penglibatan pengguna: meningkat 40%
Aduan pengguna: sifar

Penstriman adalah tentang persepsi. UI yang perlahan tetapi progresif adalah lebih baik daripada UI yang pantas tetapi statik. Pengguna lebih suka melihat jawapan muncul kata demi kata berbanding menunggu satu blok teks yang lengkap.

Jika ciri AI anda terasa lembap, cuba penstriman terlebih dahulu.

Sumber: https://dev.to/__c1b9e06dc90a7e0a676b/taming-ai-latency-streaming-responses-with-server-sent-events-42d5

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi

𝗧𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝘄𝗶𝘁𝗵 𝗦𝗦𝗘

Continue reading

𝗗𝗲𝗯𝘂𝗴𝗴𝗶𝗻𝗴 𝗔𝗜 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

Saya Membina Klien Sembang AI Penstriman Tanpa Menjadi Gila

𝗧𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝘄𝗶𝘁𝗵 𝗦𝗦𝗘

𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗦𝗲𝗿𝘃𝗲𝗿 𝗦𝗲𝗻𝘁 𝗘𝘃𝗲𝗻𝘁𝘀