𝗗𝗲𝗯𝘂𝗴𝗴𝗶𝗻𝗴 𝗔𝗜 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴

Translated for your language. Lire l'original.

AI-assisted draft.

il y a 2 semaines1min de lecture

Débogage du streaming d'IA

J'ai passé trois semaines à construire une interface de chat IA. Je voulais un flux de mots fluide. Je me suis retrouvé avec des connexions mortes et des phrases coupées.

Mon application utilisait FastAPI et React. Les réponses courtes fonctionnaient. Les réponses longues s'interrompaient au milieu d'un mot. Le serveur cessait d'envoyer des données.

J'ai essayé de corriger le problème. J'ai augmenté le timeout. Cela n'a pas fonctionné. J'ai ajouté une boucle de tentative (retry loop). Cela a généré des mots en double.

Le problème venait du parser. L'API d'IA envoie des lignes de données. Mon code fermait la connexion trop tôt. Il n'attendait pas le signal de fin.

Voici la solution :

Utilisez aiter_bytes au lieu de aiter_lines.
Gérez le tampon de lignes (line buffer) manuellement.
Recherchez le signal [DONE] pour vous arrêter.

Ensuite, mon interface utilisateur a gelé. Le serveur envoyait 50 chunks par seconde. React n'arrivait pas à suivre. J'ai ajouté un léger délai sur le serveur pour réguler le flux de données.

Leçons pour vous :

Lisez d'abord la spécification du streaming.
Ne supposez pas qu'une ligne vide signifie la fin.
Utilisez une bibliothèque pour le parsing SSE.
Suivez le nombre de chunks et les délais.

Les flux sont complexes. Ils ont leurs particularités. Ne faites jamais confiance à un flux pour se terminer proprement.

Quel est votre bug de streaming le plus étrange ?

Source: https://dev.to/__c1b9e06dc90a7e0a676b/debugging-ai-streaming-a-tale-of-chunks-and-timeouts-1p6m Optional learning community: https://t.me/GyaanSetuAi

𝗗𝗲𝗯𝘂𝗴𝗴𝗶𝗻𝗴 𝗔𝗜 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴

Continuer la lecture

𝗗𝗲𝗯𝘂𝗴𝗴𝗶𝗻𝗴 𝗔𝗜 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴: 𝗖𝗵𝘂𝗻𝗸𝘀 𝗮𝗻𝗱 𝗧𝗶𝗺𝗲𝗼𝘂𝘁𝘀

𝗪𝗵𝘆 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗥𝗲𝗹𝘆𝗶𝗻𝗴 𝗼𝗻 𝗮 𝗦𝗶𝗻𝗴𝗹𝗲 𝗔𝗜 𝗣𝗿𝗼𝘃𝗶𝗱𝗲𝗿

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗮 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗖𝗹𝗶𝗲𝗻𝘁 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗟𝗼𝘀𝗶𝗻𝗴 𝗠𝘆 𝗠𝗶𝗻𝗱

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹