𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗟𝗮𝗿𝗴𝗲 𝘃𝘀 𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗠𝗲𝗱𝗶𝘂𝗺: 𝗡𝗼𝘁𝗮𝘁𝗸𝗶 𝗖𝗧𝗢 𝘇 𝗽𝗿𝗼𝗱𝘂𝗸𝗰𝗷𝗶

Trzy miesiące temu wdrożyłem funkcję opartą na LLM. Potem przyszedł rachunek.

Zdałem sobie sprawę, że popełniłem błąd. Użyłem Mistral Large, podczas gdy powinienem był użyć Mistral Medium. Kosztowało nas to prawie 4 razy więcej, niż było to konieczne.

Jeśli prowadzisz startup, nie możesz podejmować decyzji architektonicznych na podstawie „przeczucia”. Musisz opierać je na ROI.

Błąd był prosty. Myślałem, że większe modele są zawsze lepsze. Myliłem się.

Oto jak obecnie zarządzam kosztami LLM:

  1. Klasyfikuj złożoność zadań
  1. Szacuj wolumen tokenów
  1. Mierz za pomocą rzeczywistych ewaluacji

W 70% moich zadań Mistral Medium jest wystarczający. Idealnie radzi sobie z klasyfikacją zgłoszeń wsparcia. Kosztuje jedną trzecią tego, co Large. Mistral Large rezerwuję dla zadań wymagających zaawansowanego rozumowania.

Unikam również uzależnienia od dostawcy (vendor lock-in). Używam ujednoliconego punktu końcowego (endpoint), aby uzyskać dostęp do wielu modeli. Jeśli jeden dostawca podniesie ceny, mogę zmienić model w kilka minut. To chroni mój runway.

Moja rada dla CTO:

Przestań używać wielkiego młota do zadań, które wymagają małego młotka. Wydajność tworzy przewagę konkurencyjną. Pozwala ona oferować użytkownikom lepsze funkcje i niższe ceny.

Źródło: https://dev.to/gentlenode/mistral-large-vs-mistral-medium-cto-notes-from-production-280f