Comment j'ai créé des pages de comparaison d'IA avec un petit budget

Je devais créer des pages de comparaison pour mon annuaire d'outils d'IA.

Le calcul était vertigineux. Avec 200 modèles, je faisais face à près de 20 000 paires possibles. Utiliser Claude Haiku pour générer du contenu pour chaque paire coûterait trop cher si je l'exécutais quotidiennement.

Voici comment j'ai résolu le problème en utilisant la logique et des limites.

La Stratégie

Je me suis concentré sur les requêtes à forte intention. Les utilisateurs veulent savoir « Llama 3 vs Mistral ». Ils veulent une décision, pas une longue dissertation.

J'ai utilisé ces règles pour contrôler les coûts :

• Grouper les modèles par leur tag de pipeline. • Sélectionner uniquement les 4 meilleurs modèles par nombre de téléchargements dans chaque groupe. • Fixer une limite stricte sur le nombre total de paires.

Cela a réduit mes paires de 20 000 à environ 50. Cela permet de maintenir mes coûts bas tout en couvrant les modèles les plus populaires.

La Configuration Technique

J'ai conçu un processus ETL qui s'exécute chaque nuit. Il est idempotent. Cela signifie que si la paire existe déjà dans ma base de données, le script l'ignore.

La plupart des nuits, le script s'exécute en 3 secondes et ne coûte rien (0 $) car il ignore tout.

J'utilise plusieurs astuces pour rester efficace :

• Prompt Caching : J'utilise un client Claude Haiku partagé. Comme le prompt système reste le même, la mise en cache rend les appels suivants presque gratuits. • Lean Prompts : Je tronque les résumés des modèles à 400 caractères. Cela permet de garder l'entrée courte et rapide. • Static Generation : J'utilise Astro pour transformer les données en fichiers JSON statiques. Il n'y a pas d'appels de base de données lents ni de latence des edge functions pour l'utilisateur.

Que se passe-t-il quand l'IA échoue ?

L'IA peut être imprévisible. Parfois, Claude renvoie un JSON incorrect.

J'ai écrit un système de repli (fallback). Si l'IA échoue, la page ne plante pas. À la place, elle affiche un modèle standard. Elle indique à l'utilisateur de consulter les pages individuelles des modèles. Je consigne ces échecs dans ma base de données afin de pouvoir les réessayer plus tard.

Ce que je ferais différemment

Si je devais recommencer aujourd'hui, je changerais deux choses :

  1. Comparaisons inter-pipelines : Comparer un modèle de texte à un modèle de vision est plus précieux que de comparer deux modèles de texte similaires.
  2. Sélection basée sur la recherche : Au lieu d'utiliser le nombre de téléchargements, j'utiliserais les journaux de recherche réels des utilisateurs pour décider quelles paires construire.

Construire avec des contraintes vous oblige à construire plus intelligemment.

Source : https://dev.to/morinaga/how-i-built-pairwise-ai-model-compare-pages-with-claude-haiku-and-a-budget-cap-3hpm

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi