Zu günstig, um gut zu sein? Denken Sie um!

Ich habe genug von Control Panels, die kostenlose Funktionen einschränken, um kostenpflichtige Abos zu verkaufen.

Ich bin von CyberPanel zu aaPanel gewechselt, weil ich Stabilität wollte. Aber aaPanel schränkt die Kontrolle ein. Man kann OpenLiteSpeed nicht direkt verwalten; man muss deren eigene Ebene nutzen.

Meine Anforderungen haben sich geändert. Ich nutze jetzt mehr Astro und statische Seiten. PHP brauche ich nicht mehr so intensiv. Hier verliert OpenLiteSpeed seinen Vorteil. Caddy ist besser für mich. Es verwaltet HTTPS automatisch und hat saubere Konfigurationen.

Ich habe nach einem Caddy-Control-Panel gesucht. Ich habe Tools auf GitHub gefunden, aber sie sind nicht produktionsreif. Sie sind entweder zu simpel oder unfertig.

Ich habe mich entschieden, ein minimales VPS-Management-Toolkit zu bauen. Kein Docker. Keine schweren Control Panels. Nur Shell-Skripte, ein FastAPI-Interface und Caddy auf Ubuntu 24.04.

Ich habe dieses Projekt als Benchmark für KI-Coding-Tools genutzt. Ich habe 8 Kombinationen aus Tools und Modellen getestet. Dabei bin ich in zwei Phasen vorgegangen: Architektur und Implementierung.

Ich habe sie an einem echten Projekt getestet, nicht mit einem synthetischen Test. Echte Projekte haben Sicherheitsanforderungen, Fehlerbehandlung und Anforderungen an die konsistente Dateiverknüpfung.

Hier sind die Ergebnisse:

• Die meisten Modelle versäumen es, Fragen zu stellen, bevor sie einen Plan erstellen. • Die meisten Modelle schlagen keinen einheitlichen CLI-Einstiegspunkt vor. • Viele Modelle liefern Code mit stillen, kritischen Fehlern aus.

Ich habe ein externes Modell verwendet, um den Code hinsichtlich Sicherheit, Korrektheit und Qualität zu überprüfen.

Der Gewinner war GLM 5.2 via OpenCode.

Es war das einzige Modell, das 25/25 Punkten erreichte. Es war das einzige, das produktionsreif war. Es hat seinen eigenen Code getestet, seine eigenen Bugs behoben und komplexe Grenzfälle bewältigt.

Der schockierendste Teil? Die Kosten.

• Gesamtkosten für das Gewinner-Toolkit: 1,94 $. • Geschätzte Kosten für dieselbe Aufgabe mit Copilot + Sonnet: ~25,00 $.

Der Gewinner war 13-mal günstiger als die Branchenführer.

Man braucht nicht immer das teuerste Modell. Nutzen Sie das richtige Werkzeug für die richtige Aufgabe:

  • BigPickle (Kostenlos): Am besten zum Debugging und für schnelle Fragen.
  • DeepSeek V4 Pro (0,44 $ pro Mio. Token): Am besten für Boilerplate-Code und kurze Skripte.
  • GLM 5.2 (1,40 $ pro Mio. Token): Am besten für Architektur und komplexe Sicherheit.

Hören Sie auf anzunehmen, dass ein hoher Preis hohe Qualität bedeutet. Bei Intelligenz geht es darum, Aufgaben korrekt zu routen.

Quelle: https://dev.to/pascal_cescato_692b7a8a20/too-cheap-to-be-good-think-again-4nj0

Optionale Lern-Community: https://t.me/GyaanSetuAi