Dos Picos à Economia: Otimização de Custos no Kubernetes
Nossa fatura da AWS saltou 34% em um trimestre. O roadmap do produto não mostrava mudanças. A causa era simples: nossos clusters Kubernetes estavam desperdiçando dinheiro.
Engenheiros costumam estimar quanto de CPU e memória um serviço precisa. Eles arredondam para cima para garantir a segurança. Isso cria uma capacidade fantasma. Você paga por recursos que suas aplicações nunca utilizam.
Veja como resolvemos isso e economizamos 34% nos custos mensais.
O Problema Central: Requests vs Limits
Requests são o que você garante. O Kubernetes usa esse número para alocar seu pod em um nó. Esse número é o que impulsiona sua fatura.
Limits são o teto. Se um pod atingir um limite de CPU, ele ficará mais lento. Se atingir um limite de memória, ele morre.
Muitas equipes definem requests iguais a limits. Isso significa que você paga pela capacidade de pico 24 horas por dia, 7 dias por semana, mesmo quando seu serviço está ocioso.
Nossa Estratégia para Economia
- Meça antes de agir: Use Prometheus e Grafana para ver o uso real.
- Use percentis: Observe o uso p95 ao longo de 4 semanas. Não use médias. Médias escondem picos.
- Ajuste o tamanho dos requests: Defina os requests no uso p95 mais um buffer de 20%.
- Gerencie os limites de CPU: Evite limites de CPU muito restritos em serviços sensíveis para evitar o throttling.
- Automatize o escalonamento: Use HPA para picos de tráfego e VPA para ajustar pods individuais.
Os Resultados
Reduzimos nossa contagem de nós de 40 para 26. A utilização média de CPU subiu de 14% para 52%. Os custos mensais de computação caíram de US$ 48.200 para US$ 31.900. A latência, na verdade, melhorou em 35%.
Otimização não é um projeto de uma única vez. É um hábito. Se você escreve um request de recurso baseado em um palpite, você está desperdiçando dinheiro.
Checklist para o seu cluster:
• Crie um dashboard que mostre o uso solicitado vs. o uso real. • Defina os requests com base em 4 semanas de dados. • Execute o VPA no modo de recomendação antes de permitir que ele faça alterações. • Revise as especificações de recursos a cada trimestre. • Dê visibilidade às equipes de engenharia sobre seus próprios custos.
Fonte: https://dev.to/samarth_05/from-spikes-to-savings-practical-k8s-cost-optimization-for-2026-75k
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
