Mistral Large در مقابل Mistral Medium: یادداشت‌های CTO از محیط عملیاتی

📅3 hours ago⏱1 min read

Mistral Large در مقابل Mistral Medium: یادداشت‌های CTO از محیط عملیاتی

سه ماه پیش، یک قابلیت مبتنی بر LLM را عرضه کردم. سپس صورت‌حساب رسید.

متوجه شدم که اشتباه کرده‌ام. از Mistral Large استفاده کردم در حالی که باید از Mistral Medium استفاده می‌کردم. این کار تقریباً ۴ برابر بیشتر از آنچه لازم بود برای ما هزینه داشت.

اگر یک استارتاپ را اداره می‌کنید، نمی‌توانید تصمیمات معماری را بر اساس «حس و حال» (vibes) بگیرید. باید آن‌ها را بر اساس ROI اتخاذ کنید.

اشتباه ساده بود. فکر می‌کردم مدل‌های بزرگ‌تر همیشه بهتر هستند. اشتباه می‌کردم.

در حال حاضر، من هزینه‌های LLM را به این صورت مدیریت می‌کنم:

۱. طبقه‌بندی پیچیدگی وظایف

از مدل‌های کوچک‌تر برای طبقه‌بندی یا استخراج ساده استفاده کنید.
از مدل‌های بزرگ‌تر فقط برای استدلال‌های چندمرحله‌ای استفاده کنید.

۲. تخمین حجم توکن‌ها

لاگ‌های خود را بررسی کنید.
رشد خود را پیش‌بینی کنید.
قبل از استقرار (deploy)، محاسبات را انجام دهید.

۳. اندازه‌گیری با ارزیابی‌های واقعی (evals)

به حدس و گمان خود اعتماد نکنید.
مجموعه‌ تست‌ها را روی هر دو مدل اجرا کنید.
معیارهایی را که برای محصول شما اهمیت دارند، مقایسه کنید.

برای ۷۰٪ از وظایف من، Mistral Medium کافی است. این مدل طبقه‌بندی تیکت‌های پشتیبانی را به شکلی عالی انجام می‌دهد. هزینه آن یک‌سوم هزینه‌ی مدل Large است. من مدل Large را برای وظایف استدلالی سطح بالا رزرو می‌کنم.

همچنین از وابستگی به یک فروشنده خاص (vendor lock-in) اجتناب می‌کنم. من از یک نقطه اتصال (endpoint) یکپارچه برای دسترسی به مدل‌های مختلف استفاده می‌کنم. اگر یکی از ارائه‌دهندگان قیمت‌ها را بالا ببرد، در عرض چند دقیقه مدل را تغییر می‌دهم. این کار از Runway (میزان نقدینگی موجود) من محافظت می‌کند.

توصیه من برای CTOها:

برای کاهش هزینه‌ها، به شکلی تهاجمی از Cache استفاده کنید.
برای بهبود تجربه کاربری، پاسخ‌ها را به صورت Stream ارسال کنید.
منطق جایگزین (fallback logic) بسازید تا سیستم شما آنلاین بماند.
قبل از بهینه‌سازی پرامپت (prompt)، مدل را انتخاب کنید.
الزامات پنجره بافت (context window) را برای هر وظیفه بررسی کنید.

از استفاده از پتک برای کارهایی که به یک چکش کوچک نیاز دارند، دست بردارید. کارایی، مزیت رقابتی ایجاد می‌کند. این کار به شما اجازه می‌دهد ویژگی‌های بهتر و قیمت‌های پایین‌تری را به کاربران خود ارائه دهید.

منبع: https://dev.to/gentlenode/mistral-large-vs-mistral-medium-cto-notes-from-production-280f

Mistral Large در مقابل Mistral Medium: یادداشت‌های CTO از محیط عملیاتی

Continue reading

𝗟𝗟𝗠 𝗚𝗔𝗧𝗘𝗪𝗔𝗬𝗦 𝗙𝗢𝗥 𝗔𝗜 𝗦𝗔𝗔𝗦

مدیریت هزینه ابری در مقابل بهینه‌سازی

من یک LLM را بازتنظیم کردم و سپس گفتم نه

به سوی سرویس‌دهی کارآمد LLM

MVP در مقابل MLP: چگونه استراتژی مناسب برای عرضه را انتخاب کنیم؟