𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Translated for your language. Leer el original.

AI-assisted draft.

anteayer2min de lectura

Intenté añadir un chat de IA a mi aplicación y me topé con un muro

Intenté añadir un asistente de chat con IA a mi herramienta de gestión de proyectos. Pensé que sería fácil. Planeé enviar todo el historial del chat a una API.

Falló.

Después de 15 mensajes, las respuestas se volvieron lentas o fallaban. La API arrojaba errores porque el texto era demasiado largo para el límite de tokens.

Esto es lo que intenté y lo que funcionó.

Los problemas que enfrenté:

Truncar el historial: Solo mantenía los últimos mensajes. Esto solucionó la velocidad, pero la IA olvidaba todo lo ocurrido al inicio del chat.
Resumen (Summarization): Le pedía a la IA que resumiera el chat cada 5 mensajes. Esto ayudó a la memoria, pero aumentó mis costos y tiempos de espera.
Almacenes vectoriales (Vector stores): Intenté calificar los mensajes por relevancia. Esto añadió demasiada complejidad para mis necesidades.

La solución:

Dejé de intentar enviarlo todo. Utilicé dos métodos principales para mejorar la experiencia.

Streaming: Utilicé Server-Sent Events para mostrar el texto a medida que se genera. Esto hace que la aplicación se sienta rápida, incluso si la IA tarda tiempo en pensar.
Una ventana de contexto de tres ranuras: Dividí mi presupuesto de tokens en partes específicas.

System Prompt: 500 tokens. Este se mantiene igual.
Contexto dinámico: 2000 tokens. Este contiene actualizaciones recientes del proyecto y estados de las tareas.
Historial de conversación: 4000 tokens. Esta es una ventana deslizante de mensajes recientes.

Al gestionar el presupuesto de esta manera, reduje el tamaño de mi carga útil (payload) en un 40%. Esto ahorró dinero y redujo la latencia.

Mi consejo:

Añadir IA no se trata solo de llamar a una API. Debes gestionar cuántos datos envías. El streaming mejora la percepción de velocidad del usuario. Una estrategia de contexto inteligente mejora la percepción de inteligencia de la IA.

¿Cómo gestionas la memoria de la conversación en tus aplicaciones? ¿Utilizas ventanas deslizantes o resúmenes?

Fuente: https://dev.to/__c1b9e06dc90a7e0a676b/i-tried-to-add-ai-chat-to-my-app-and-hit-a-wall-with-context-tokens-459b

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Seguir leyendo

Gestión del contexto de conversación para IA

Cómo evité que mi función de IA vaciara mi billetera

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

Intenté añadir un chat de IA a mi aplicación y me topé con un muro

Deja de decirle a tu IA que tenga cuidado