Wie ich KI-Vergleichsseiten mit kleinem Budget erstellt habe
Ich musste Vergleichsseiten für mein Verzeichnis von KI-Tools erstellen.
Die Mathematik dahinter war beängstigend. Bei 200 Modellen stand ich vor fast 20.000 möglichen Paaren. Die Verwendung von Claude Haiku zur Generierung von Inhalten für jedes einzelne Paar wäre zu teuer gewesen, wenn ich dies täglich ausgeführt hätte.
Hier ist die Lösung, die ich mithilfe von Logik und Limits gefunden habe.
Die Strategie
Ich habe mich auf Suchanfragen mit hoher Intention (High-Intent Queries) konzentriert. Nutzer wollen wissen: „Llama 3 vs. Mistral“. Sie wollen eine Entscheidung, keinen langen Aufsatz.
Ich habe diese Regeln verwendet, um die Kosten zu kontrollieren:
• Modelle nach ihrem Pipeline-Tag gruppieren. • In jeder Gruppe nur die Top 4 Modelle nach Download-Anzahl auswählen. • Ein hartes Limit für die Gesamtzahl der Paare festlegen.
Dadurch reduzierte ich die Anzahl der Paare von 20.000 auf etwa 50. Das hält meine Kosten niedrig und deckt gleichzeitig die beliebtesten Modelle ab.
Das technische Setup
Ich habe einen ETL-Prozess entwickelt, der jede Nacht läuft. Er ist idempotent. Das bedeutet: Wenn das Paar bereits in meiner Datenbank existiert, überspringt das Skript es.
Die meisten Nächte läuft das Skript in 3 Sekunden und kostet 0 $, weil es alles überspringt.
Ich verwende mehrere Tricks, um es effizient zu halten:
• Prompt Caching: Ich verwende einen gemeinsamen Claude Haiku Client. Da der System-Prompt gleich bleibt, macht das Caching nachfolgende Aufrufe nahezu kostenlos. • Lean Prompts: Ich kürze die Modellzusammenfassungen auf 400 Zeichen. Das hält den Input klein und schnell. • Static Generation: Ich verwende Astro, um die Daten in statische JSON-Dateien umzuwandeln. Es gibt keine langsamen Datenbankabfragen oder Latenzen durch Edge Functions für den Nutzer.
Was passiert, wenn es fehlschlägt?
KI kann unvorhersehbar sein. Manchmal liefert Claude fehlerhaftes JSON zurück.
Ich habe ein Fallback-System geschrieben. Wenn die KI scheitert, stürzt die Seite nicht ab. Stattdessen wird ein Standard-Template angezeigt. Es weist den Nutzer darauf hin, die einzelnen Modellseiten zu prüfen. Ich erfasse diese Fehler in meiner Datenbank, um sie später erneut zu versuchen.
Was ich anders machen würde
Wenn ich heute von vorne anfangen würde, würde ich zwei Dinge ändern:
- Pipeline-übergreifende Vergleiche: Der Vergleich eines Textmodells mit einem Vision-Modell ist wertvoller als der Vergleich zweier ähnlicher Textmodelle.
- Suchanfrage-gesteuerte Auswahl: Anstatt Download-Zahlen zu verwenden, würde ich tatsächliche Suchprotokolle der Nutzer nutzen, um zu entscheiden, welche Paare erstellt werden sollen.
Das Bauen unter Einschränkungen zwingt einen dazu, smarter zu bauen.
Optionale Lern-Community: https://t.me/GyaanSetuAi
