𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗟𝗮𝗿𝗴𝗲 𝗱𝗵𝗶𝗱𝗶 𝗻𝗮 𝗠𝗶𝘀𝘁𝗿𝗮𝗹 𝗠𝗲𝗱𝗶𝘂𝗺: 𝗠𝗮𝗲𝗹𝗲𝘇𝗼 𝘆𝗮 𝗖𝗧𝗢 𝗞𝘂𝘁𝗼𝗸𝗮 𝗸𝗮𝘁𝗶𝗸𝗮 𝗨𝘇𝗮𝗹𝗶𝘀𝗵𝗮𝗷𝗶

Miezi mitatu iliyopita, nilizindua kipengele cha LLM. Kisha bili ikaja.

Niligundua kuwa nilifanya kosa. Nilitumia Mistral Large wakati ningetakiwa kutumia Mistral Medium. Hii ilitugharimu karibu mara 4 zaidi ya ilivyohitajika.

Ikiwa unaendesha startup, huwezi kufanya maamuzi ya usanifu (architecture) kulingana na hisia tu. Lazima uyafanye kulingana na ROI.

Kosa ni rahisi. Nilidhani kuwa mifano mikubwa zaidi daima ni bora zaidi. Nilikuwa nimekosea.

Hivi ndivyo ninavyodhibiti gharama za LLM sasa:

  1. Panga ugumu wa kazi
  1. Kadiria kiasi cha tokeni
  1. Pima kwa kutumia evals halisi

Kwa 70% ya kazi zangu, Mistral Medium inatosha. Inashughulikia uainishaji wa tiketi za msaada (support tickets) kikamilifu. Inagharimu thuluthi moja ya kile ambacho Large inatoza. Nimehifadhi Large kwa ajili ya kazi za utafakari wa kiwango cha juu.

Pia niepuke vendor lock-in. Ninatumia unified endpoint ili kupata mifano mingi. Ikiwa mtoa huduma mmoja ataongeza bei, mimi hubadilisha mifano ndani ya dakika chache. Hii inalinda runway yangu.

Ushauri wangu kwa CTOs:

Acha kutumia nyundo kubwa kwa kazi zinazohitaji nyundo ndogo. Ufanisi huleta faida za ushindani. Inakuwezesha kutoa vipengele bora na bei nafuu kwa watumiaji wako.

Chanzo: https://dev.to/gentlenode/mistral-