Укрощение задержки ИИ с помощью SSE

Translated for your language. Читать оригинал.

AI-assisted draft.

3 часа назад1мин чтения

Укрощение задержки ИИ с помощью SSE

Я разработал функцию автодополнения на базе ИИ. Пользователям она не понравилась.

Каждое нажатие клавиши отправляло запрос к модели ИИ. Пользователи ждали полного ответа от 2 до 3 секунд. Интерфейс казался сломанным.

Я пробовал дебаунсинг. Я пробовал кэширование. Я пробовал индикаторы загрузки. Ничего не помогало. Основная проблема оставалась: пользователям приходилось ждать весь ответ целиком, прежде чем они могли увидеть хоть какие-то данные.

Я решил эту проблему с помощью Server-Sent Events (SSE), чтобы транслировать ответы по частям (chunks).

Исходный медленный процесс:

Пользователь вводит символы
Дебаунсинг 300 мс
HTTP POST запрос
Сервер вызывает AI API (1–2 секунды)
Сервер возвращает полный ответ
Клиент отрисовывает результат

Пользователь ничего не видел в течение 2 секунд.

Я рассматривал поллинг (polling), но он создает слишком большую нагрузку. WebSockets работают, но они слишком тяжеловесны для одностороннего потока.

Я выбрал SSE. Это стандарт, при котором сервер отправляет текстовые события через одно длительное соединение.

Почему SSE подходит для ИИ:

Он односторонний (от сервера к клиенту)
Он использует текстовые JSON-чанки
Он автоматически обрабатывает переподключения
Вам не нужны дополнительные библиотеки

Результаты были мгновенными. Первое слово появлялось менее чем за 300 мс. Пользователи видели, как подсказки формируются буква за буквой.

Мои метрики улучшились:

Время до первого визуального ответа: с 2,1 с до 0,3 с
Вовлеченность пользователей: +40%
Жалобы пользователей: ноль

Стриминг — это вопрос восприятия. Медленный, но прогрессивный интерфейс лучше быстрого, но статичного. Пользователи предпочитают видеть, как ответ появляется слово за словом, вместо того чтобы ждать целый блок текста.

Если ваша функция ИИ кажется медлительной, сначала попробуйте стриминг.

Source: https://dev.to/__c1b9e06dc90a7e0a676b/taming-ai-latency-streaming-responses-with-server-sent-events-42d5

Optional learning community: https://t.me/GyaanSetuAi

Укрощение задержки ИИ с помощью SSE

Продолжить чтение

Отладка AI-стриминга

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗮 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗖𝗹𝗶𝗲𝗻𝘁 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗟𝗼𝘀𝗶𝗻𝗴 𝗠𝘆 𝗠𝗶𝗻𝗱

𝗧𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝘄𝗶𝘁𝗵 𝗦𝗦𝗘

𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗦𝗲𝗿𝘃𝗲𝗿 𝗦𝗲𝗻𝘁 𝗘𝘃𝗲𝗻𝘁𝘀