𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Translated for your language. Ler o original.

AI-assisted draft.

anteontem2min de leitura

𝗘𝘂 𝘁𝗲𝗻𝘁𝗲𝗶 𝗮𝗱𝗶𝗰𝗶𝗼𝗻𝗮𝗿 𝗰𝗵𝗮𝘁 𝗱𝗲 𝗜𝗔 𝗮𝗼 𝗺𝗲𝘂 𝗮𝗽𝗽 𝗲 𝗯𝗮𝘁𝗶 𝗲𝗺 𝘂𝗺 𝗺𝘂𝗿𝗼

Tentei adicionar um assistente de chat de IA à minha ferramenta de gerenciamento de projetos. Achei que seria fácil. Planejei enviar todo o histórico do chat para uma API.

Falhou.

Após 15 mensagens, as respostas tornaram-se lentas ou apresentaram erros. A API retornou erros porque o texto era longo demais para o limite de tokens.

Aqui está o que eu tentei e o que funcionou.

Os problemas que enfrentei:

Truncar o histórico: Mantive apenas as últimas mensagens. Isso resolveu a velocidade, mas a IA esqueceu tudo o que aconteceu no início do chat.
Sumarização: Pedi à IA para resumir o chat a cada 5 mensagens. Isso ajudou na memória, mas aumentou meus custos e tempos de espera.
Vector stores: Tentei pontuar as mensagens por relevância. Isso adicionou complexidade demais para as minhas necessidades.

A solução:

Parei de tentar enviar tudo. Usei dois métodos principais para corrigir a experiência.

Streaming: Usei Server-Sent Events para mostrar o texto conforme ele é gerado. Isso faz com que o app pareça rápido, mesmo que a IA leve um tempo para pensar.
Uma janela de contexto de três slots: Dividi meu orçamento de tokens em partes específicas.

System Prompt: 500 tokens. Este permanece constante.
Contexto dinâmico: 2000 tokens. Este contém atualizações recentes do projeto e estados das tarefas.
Histórico de conversa: 4000 tokens. Esta é uma janela deslizante de mensagens recentes.

Ao gerenciar o orçamento dessa forma, reduzi o tamanho do meu payload em 40%. Isso economizou dinheiro e diminuiu a latência.

Meu conselho:

Adicionar IA não é apenas chamar uma API. Você deve gerenciar a quantidade de dados que envia. O streaming melhora a percepção de velocidade do usuário. Uma estratégia de contexto inteligente melhora a percepção de inteligência da IA.

Como você gerencia a memória de conversação em seus apps? Você usa janelas deslizantes ou sumarização?

Fonte: https://dev.to/__c1b9e06dc90a7e0a676b/i-tried-to-add-ai-chat-to-my-app-and-hit-a-wall-with-context-tokens-459b

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Continuar lendo

𝗖𝗼𝗻𝘃𝗲𝗿𝘀𝗮𝘁𝗶𝗼𝗻 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗠𝗮𝗻𝗮𝗴𝗲𝗺𝗲𝗻𝘁 𝗳𝗼𝗿 𝗔𝗜

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹