Como Construí uma Escada de Qualidade de Conteúdo de Três Níveis

Escalar sites programáticos é difícil. Se você depender apenas de IA para escrever seu conteúdo, seu site quebrará quando a API cair.

Lancei três sites de diretório: Top AI Tools, Find Games Like e Open Alternative To. Utilizo uma escada de conteúdo de três níveis para garantir que eles sempre exibam informações, mesmo sem uma conexão de IA ativa.

O sistema utiliza uma única coluna no banco de dados chamada model_used. Ela rastreia três níveis de qualidade:

  • seeded-from-json: Dados básicos de um arquivo. É estruturado, mas raso.
  • fallback-template: Um template padrão usado se a IA falhar ou se a chave da API estiver faltando. É tecnicamente correto, mas carece de personalidade.
  • claude-haiku-4-5: O estado desejado. Isso fornece resumos editoriais de alta qualidade e detalhes com nuances.

Utilizo uma consulta SQL específica para gerenciar as atualizações. O script procura por duas coisas:

  1. Novas entradas que ainda não possuem conteúdo.
  2. Entradas existentes que possuem apenas conteúdo de baixa qualidade (seeded ou fallback).

O script as ordena por popularidade. Ele atualiza primeiro as páginas mais visitadas. Isso garante que suas páginas de maior tráfego recebam o melhor conteúdo imediatamente.

O processo é totalmente automatizado e idempotente. Utilizo um padrão de upsert. Se uma atualização for bem-sucedida, o banco de dados sobrescreve o antigo conteúdo de fallback com o novo conteúdo de IA. A coluna model_used se atualiza sozinha.

Também utilizo o prompt caching da Anthropic. Isso economiza muito dinheiro e tokens. Como meus system prompts são os mesmos para cada entrada, a primeira chamada prepara o cache. As próximas 99 chamadas em um lote leem desse cache a um custo menor.

Principais escolhas arquiteturais:

  • Tratamento de erros: Se o Claude falhar, o sistema não trava. Ele simplesmente escreve o template de fallback e passa para o próximo item.
  • Segurança de SEO: Se uma página não tiver conteúdo útil algum, utilizo uma tag noindex. Isso evita que o Google indexe páginas vazias.
  • Builds estáticos: Exporto o banco de dados para arquivos JSON para o Astro. Isso significa que meu site permanece online mesmo se o banco de dados ou a API de IA sofrer uma interrupção.

Essa configuração me permite construir rápido sem arriscar a estabilidade do site.

Fonte: https://dev.to/morinaga/how-i-built-a-three-tier-content-quality-ladder-for-programmatic-directory-etl-483