Minha integração de IA custava caro demais até eu mudar minha abordagem

Translated for your language. Ler o original.

AI-assisted draft.

GyaanSetu Editorialanteontem2min de leitura

𝗠𝗶𝗻𝗵𝗮 𝗜𝗻𝘁𝗲𝗴𝗿𝗮𝗰̧𝗮̃𝗼 𝗱𝗲 𝗜𝗔 𝗘𝗿𝗮 𝗖𝗮𝗿𝗮 𝗗𝗲𝗺𝗮𝗶𝘀 𝗔𝘁𝗲́ 𝗤𝘂𝗲 𝗠𝘂𝗱𝗲𝗶 𝗠𝗶𝗻𝗵𝗮 𝗔𝗯𝗼𝗿𝗱𝗮𝗴𝗲𝗺

Eu adorava meu recurso de sumarização de IA até que a conta chegou.

No mês passado, construí uma ferramenta para resumir artigos longos. Usei o GPT-4 com um prompt simples. Funcionou perfeitamente. Os usuários adoraram a qualidade.

Então a conta chegou. Um mês de uso me custou mais de US$ 1.200. Eu precisava consertar isso ou descontinuar o recurso.

Tentei várias coisas para resolver:

Mudei para o GPT-3.5-turbo. O custo diminuiu, mas a qualidade caiu. Os resumos ficaram vagos.
Tentei engenharia de prompt. Adicionar "seja específico" não ajudou o suficiente.
Tentei reduzir o tamanho da entrada usando bibliotecas extrativas. Isso ajudou, mas os custos continuaram altos.

Percebi que estava usando uma marreta para um prego pequeno.

A solução é um pipeline de duas etapas. Você combina dois métodos diferentes para obter os melhores resultados.

Etapa 1: A Fase Extrativa Use uma ferramenta barata e rápida como o TextRank para selecionar as 5 a 10 principais frases do artigo. Isso remove 90% do texto extra.

Etapa 2: A Fase Abstrativa Envie apenas essas poucas frases para um modelo pequeno e barato como o GPT-3.5-turbo. Peça para ele reescrever essas frases em um resumo limpo de 3 tópicos.

Essa abordagem reduziu meus custos em 80%. A qualidade permaneceu próxima à do GPT-4 porque o modelo processou apenas os dados mais importantes.

Outras dicas para seus projetos de IA:

Use cache. Armazene os resultados pelo hash do artigo para não pagar pelo mesmo resumo duas vezes.
Use camadas. Divida tarefas complexas em subtarefas menores e mais baratas.
Defina um fallback. Se um artigo for muito complexo, use um modelo de alta qualidade como o GPT-4 apenas para esses casos específicos.

Pare de enviar blocos enormes de texto para modelos caros. Reduza os dados primeiro.

Como você equilibra a qualidade da IA e o custo em seus produtos? Você usa modelos diferentes para tarefas diferentes?

Fonte: https://dev.to/__c1b9e06dc90a7e0a676b/my-ai-integration-had-terrible-costs-until-i-changed-my-approach-pml

Minha integração de IA custava caro demais até eu mudar minha abordagem

Continuar lendo

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

Como reduzi nossa conta de API de IA pela metade enquanto atingia 99 SLAs

𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁'𝘀 𝗧𝗼𝗸𝗲𝗻 𝗕𝗶𝗹𝗹 𝗯𝘆 𝟲𝟮% 𝗶𝗻 𝗢𝗻𝗲 𝗪𝗲𝗲𝗸𝗲𝗻𝗱

7 Maneiras de Reduzir sua Fatura de IA