Zbyt tanie, by było dobre? Pomyśl jeszcze raz.

Mam dość paneli kontrolnych, które blokują darmowe funkcje, aby sprzedawać płatne plany.

Przeszedłem z CyberPanel na aaPanel, ponieważ zależało mi na stabilności. Ale aaPanel ogranicza kontrolę. Nie można nim zarządzać bezpośrednio OpenLiteSpeed. Musisz korzystać z ich warstwy.

Moje potrzeby się zmieniły. Teraz częściej korzystam z Astro i stron statycznych. Nie potrzebuję już tak bardzo PHP. W tym przypadku OpenLiteSpeed traci swoją przewagę. Dla mnie lepszy jest Caddy. Automatycznie obsługuje HTTPS i ma przejrzyste konfiguracje.

Szukałem panelu kontrolnego dla Caddy. Znalazłem narzędzia na GitHubie, ale nie są one gotowe do użytku produkcyjnego. Są albo zbyt proste, albo niedokończone.

Postanowiłem zbudować minimalny zestaw narzędzi do zarządzania VPS. Bez Docker. Bez ciężkich paneli kontrolnych. Tylko skrypty shell, interfejs FastAPI i Caddy na Ubuntu 24.04.

Użyłem tego projektu jako benchmarku dla narzędzi AI do kodowania. Przetestowałem 8 kombinacji narzędzi i modeli. Przeprowadziłem dwie fazy: Architekturę i Implementację.

Przetestowałem je na prawdziwym projekcie, a nie na syntetycznym teście. Prawdziwe projekty mają wymagania dotyczące bezpieczeństwa, obsługi błędów i spójności między plikami.

Oto wyniki:

• Większość modeli nie zadaje pytań przed stworzeniem planu. • Większość modeli nie proponuje ujednoliconego punktu wejścia CLI. • Wiele modeli dostarcza kod z cichymi, krytycznymi błędami.

Użyłem zewnętrznego modelu do recenzji kodu pod kątem bezpieczeństwa, poprawności i jakości.

Zwycięzcą został GLM 5.2 przez OpenCode.

Był to jedyny model, który zdobył 25/25. Był jedynym gotowym do produkcji. Przetestował własny kod, naprawił własne błędy i poradził sobie ze złożonymi przypadkami brzegowymi.

Najbardziej szokująca część? Koszt.

• Całkowity koszt zwycięskiego zestawu narzędzi: $1.94. • Szacowany koszt wykonania tego samego zadania na Copilot + Sonnet: ~$25.00.

Zwycięzca był 13 razy tańszy niż liderzy branży.

Nie zawsze potrzebujesz najdroższego modelu. Używaj odpowiedniego narzędzia do odpowiedniego zadania:

  • BigPickle (Darmowe): Najlepsze do debugowania i szybkich pytań.
  • DeepSeek V4 Pro ($0.44/M tokenów): Najlepsze do boilerplate'u i krótkich skryptów.
  • GLM 5.2 ($1.40/M tokenów): Najlepsze do architektury i złożonego bezpieczeństwa.

Przestań zakładać, że wysoka cena oznacza wysoką jakość. Inteligencja polega na poprawnym kierowaniu zadaniami.

Źródło: https://dev.to/pascal_cescato_692b7a8a20/too-cheap-to-be-good-think-again-4nj0

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi