𝟰𝟮/𝟲𝟬 𝗗𝗮𝘆𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗗𝗲𝘀𝗶𝗴𝗻 𝗤𝘂𝗲𝘀𝘁𝗶𝗼𝗻𝘀

📅3 hours ago⏱1 min read

𝟰𝟮/𝟲𝟬 𝗗𝗶𝗮𝘀 𝗱𝗲 𝗣𝗿𝗲𝗴𝘂𝗻𝘁𝗮𝘀 𝗱𝗲 𝗗𝗲𝘀𝗲𝗻𝗵𝗼 𝗱𝗲 𝗦𝗶𝘀𝘁𝗲𝗺𝗮

Seu agente de IA lembra o nome de um usuário.

Um usuário pede a um agente para reservar um voo barato para NYC. Ele pede hotéis por menos de US$ 150 por noite. Ele pede uma comparação do custo total da viagem.

No terceiro passo, o agente envia 8.000 tokens de histórico para o LLM. Ele responde como se fosse o primeiro turno do chat.

Você precisa de uma arquitetura de memória antes de lançar isso.

Escolha uma:

Janela de contexto (In-context window): Mantenha todo o histórico no prompt. É simples. Falha após 15 turnos ou 8.000 tokens.
Armazenamento de memória vetorial (Vector memory store): Gere embeddings de turnos passados. Recupere as melhores correspondências por similaridade. Isso falha quando uma busca por "voo para NYC" puxa uma memória de uma viagem antiga em vez da tarefa atual.
Memória episódica com sumarização (Episodic memory with summarization): Comprima turnos antigos em resumos estruturados. Injete resumos relevantes em cada requisição. É mais difícil de construir. É mais difícil de confundir.
Estado de sessão no Redis (Redis session state): Use um armazenamento estruturado de chave-valor. O agente lê e escreve explicitamente. É determinístico. O agente deve saber o que armazenar e quando.

Uma opção falha após 15 turnos. Uma recupera o contexto errado no momento errado. Uma é a escolha correta para agentes orientados a tarefas.

Escolha A, B, C ou D. Diga-me se você enfrentou isso em produção.

Eu compartilho a análise completa nos comentários.

Fonte: https://dev.to/thejoud1997/4260-days-system-design-questions-4018

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi

𝟰𝟮/𝟲𝟬 𝗗𝗮𝘆𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗗𝗲𝘀𝗶𝗴𝗻 𝗤𝘂𝗲𝘀𝘁𝗶𝗼𝗻𝘀

Continue reading

A Maneira Certa de Construir uma Arquitetura de IA

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

𝗔𝗱𝗱𝗶𝗻𝗴 𝗠𝗲𝗺𝗼𝗿𝘆 𝘁𝗼 𝘁𝗵𝗲 𝗔𝗴𝗲𝗻𝘁

O Agente Funcionou. O Plano de Manutenção Não.

Agentes precisam de histórico pessoal