Отладка AI-стриминга

Translated for your language. Читать оригинал.

AI-assisted draft.

2 недели назад1мин чтения

Отладка AI-стриминга

Я потратил три недели на создание интерфейса чата с AI. Я хотел плавный поток слов, а получил обрывы соединений и незаконченные предложения.

Мое приложение использовало FastAPI и React. Короткие ответы работали. Длинные ответы обрывались на полуслове. Сервер переставал отправлять данные.

Я пытался это исправить. Увеличил таймаут — не помогло. Добавил цикл повторных попыток — это привело к дублированию слов.

Проблема была в парсере. AI API отправляет строки данных. Мой код закрывал соединение слишком рано. Он не дожидался сигнала об окончании.

Вот решение:

Используйте aiter_bytes вместо aiter_lines.
Управляйте буфером строк вручную.
Ищите сигнал [DONE], чтобы остановиться.

Затем мой UI завис. Сервер отправлял по 50 чанков в секунду. React не справлялся. Я добавил небольшую задержку на сервере, чтобы ограничить скорость передачи данных (throttle).

Уроки для вас:

Сначала изучите спецификацию стриминга.
Не считайте пустую строку признаком окончания.
Используйте библиотеку для парсинга SSE.
Отслеживайте количество чанков и задержки.

Стриминг — штука запутанная. У него есть свои причуды. Никогда не полагайтесь на то, что поток завершится корректно сам по себе.

Какой ваш самый странный баг со стримингом?

Источник: https://dev.to/__c1b9e06dc90a7e0a676b/debugging-ai-streaming-a-tale-of-chunks-and-timeouts-1p6m Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi

Отладка AI-стриминга

Продолжить чтение

𝗗𝗲𝗯𝘂𝗴𝗴𝗶𝗻𝗴 𝗔𝗜 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴: 𝗖𝗵𝘂𝗻𝗸𝘀 𝗮𝗻𝗱 𝗧𝗶𝗺𝗲𝗼𝘂𝘁𝘀

Почему я перестал полагаться на одного ИИ-провайдера

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗮 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗖𝗹𝗶𝗲𝗻𝘁 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗟𝗼𝘀𝗶𝗻𝗴 𝗠𝘆 𝗠𝗶𝗻𝗱

Я пытался добавить ИИ-чат в свое приложение и зашел в тупик