O que impulsiona sua conta de geração de imagens
A maioria das pessoas pensa que a resolução ou o comprimento do prompt impulsionam os custos da API de imagem. Elas estão erradas.
Testamos a geração de imagens em quatro variáveis: modelo, resolução, contagem de imagens e qualidade. Aqui está o que descobrimos.
A Armadilha da Qualidade
A maior alavanca de custo é a configuração de qualidade. A maioria das APIs permite escolher entre qualidade baixa, média ou alta.
Para modelos como gpt-image, você paga por token. Alta qualidade não significa mais pixels. Significa mais esforço de renderização.
Testamos o mesmo prompt na mesma resolução. O tamanho do arquivo permaneceu o mesmo. No entanto, a configuração de alta qualidade custou 36x mais do que a configuração de baixa qualidade.
Você paga pelo trabalho que o modelo realiza, não pelo tamanho do arquivo.
Principais Descobertas
• A imagem é o custo, não o prompt. Em text-to-image, seu prompt é um erro de arredondamento. Se você usar image-to-image, a imagem de entrada torna-se um custo massivo.
• A escolha do modelo é uma alavanca de 6x. Diferentes formatos de cobrança alteram seu gasto total. Alguns modelos cobram por token. Outros cobram uma taxa fixa por imagem.
• A resolução é uma alavanca fraca. Aumentar a resolução nem sempre aumenta o custo proporcionalmente. Em alguns modelos, o custo permanece constante, independentemente do tamanho.
• O cache não funciona. Muitas pessoas tentam usar o cache de prompt para economizar dinheiro. A geração de imagens é stateless. Você não pode reutilizar o estado do prompt para reduzir sua conta.
• O batching não economiza dinheiro. Gerar quatro imagens em uma única chamada geralmente cobra o prompt quatro vezes. Não há compartilhamento de custos.
Como Escolher um Modelo
Se você precisa de rascunhos ou miniaturas de baixa qualidade: Use um modelo por token. É a opção mais barata para trabalhos de baixa fidelidade.
Se você precisa de imagens de média ou alta qualidade: Use um modelo de taxa fixa por imagem. Os custos por token explodem em alta qualidade. Uma taxa fixa é mais previsível e geralmente mais barata para trabalhos profissionais.
Se você estiver fazendo edição image-to-image: Opte por modelos de taxa fixa por imagem. Eles geralmente incluem imagens de referência gratuitamente. Modelos por token cobram extra por cada imagem de referência que você fornece.
Pare de usar a alta qualidade por padrão. Ajuste sua qualidade de acordo com o trabalho.
Fonte: https://dev.to/synthorai/what-actually-drives-your-image-generation-bill-2bc2