MLOps برای LLM: مطالعه موردی Dresscode
گذار از یک اثبات مفهوم (PoC) به یک محصول واقعی دشوار است.
من Dresscode را ساختم، یک استایلیست هوش مصنوعی. این برنامه از Gemma 4 برای دیجیتالی کردن کمد لباس و پیشنهاد ستهای پوشاک بر اساس وضعیت آبوهوای لحظهای استفاده میکند.
یک ایده عالی به چیزی فراتر از یک مدل نیاز دارد؛ به MLOps نیاز دارد.
MLOps باعث میشود هوش مصنوعی شما دقیق، قابل اعتماد و از نظر هزینه مقرونبهصرفه باقی بماند. در اینجا خط لوله (pipeline) ۷ مرحلهای که برای مقیاسپذیری هوش مصنوعی استفاده میکنم، آورده شده است.
۱. جذب و مهندسی دادهها (Data Ingestion and Engineering)
دادههای خام نامنظم هستند. در Dresscode، کاربران عکسهایی با کیفیت بالا آپلود میکنند. • جذب (Ingestion): ما عکسها را از طریق API به فضای ذخیرهسازی ابری منتقل میکنیم. • مهندسی (Engineering): ما عکسهای ۱۲ مگابایتی گوشیهای هوشمند را فشرده میکنیم تا در هزینهها صرفهجویی کرده و سرعت پردازش را بالا ببریم. همچنین برای حفظ حریم خصوصی، متادیتاها (metadata) را حذف میکنیم. • پاکسازی متن (Text Cleaning): ما دادههای API آبوهوا را پاکسازی میکنیم تا پرامپتها (prompts) کوتاه و کارآمد باقی بمانند.
۲. ذخیرهساز ویژگی (Feature Store)
ویژگیها (Features) جزئیات خاصی هستند که هوش مصنوعی برای تصمیمگیری از آنها استفاده میکند. • برای تصاویر: ما امبدینگهای ریاضی (embeddings/vectors) را ذخیره میکنیم. این کار از پردازش مجدد یک تصویر جلوگیری میکند. • برای آبوهوا: ما دادههای خام را به دستههایی مانند «سرد» یا «بارانی» تبدیل میکنیم. • مزیت: یک Feature Store به شما اجازه میدهد به جای محاسبه مجدد، این جزئیات را فوراً فراخوانی کنید.
۳. آموزش مدل و آزمایش (Model Training and Experimentation)
ما Gemma 4 را از صفر آموزش نمیدهیم. تمرکز ما بر مهندسی پرامپت (Prompt Engineering) و ارزیابی است. • آزمایش (Experimentation): ما پرامپتهای سیستمی مختلف را تست میکنیم تا مطمئن شویم هوش مصنوعی خروجی JSON تمیزی تولید میکند. • یکپارچهسازی مداوم (CI): ما از یک «مجموعه داده طلایی» (Golden Dataset) شامل ۱۰۰ عکس استفاده میکنیم. هر بار که پرامپتی را تغییر میدهیم، سیستم بررسی میکند که آیا دقت بالای ۹۵٪ باقی میماند یا خیر.
۴. ثبت مدل (Model Registry)
این را مانند یک اپاستور برای مدلهای خود تصور کنید. • ما پرامپتها و پیکربندیهای مدل را با نسخهبندی ذخیره میکنیم. • اگر یک پرامپت جدید باعث شود هوش مصنوعی در تابستان کت پیشنهاد دهد، میتوانیم با کلیک روی "Rollback" فوراً به یک نسخه پایدار بازگردیم.
۵. استقرار و سرویسدهی مداوم (Continuous Deployment and Serving)
این روشی است که مدل را به دست کاربر میرسانید. • وظایف بصری (Visual Tasks): ما از صفهای ناهمگام (asynchronous queues) استفاده میکنیم. کاربران عکسها را آپلود میکنند و ما آنها را در پسزمینه پردازش میکنیم تا سرعت اپلیکیشن حفظ شود. • وظایف متنی (Text Tasks): ما از استریم کردن توکنها (token streaming) استفاده میکنیم. این کار پیشنهاد ست پوشاک را کلمه به کلمه نمایش میدهد تا کاربر منتظر صفحه بارگذاری نماند.
۶. نظارت مداوم (Continuous Monitoring)
عملکرد هوش مصنوعی میتواند با گذشت زمان کاهش یابد. ما سه مورد را زیر نظر میگیریم: • عملکرد سیستم: آیا تأخیر (latency) در حال افزایش است؟ • تغییر توزیع دادهها (Data Drift): آیا کاربران فرمتهای جدیدی از عکس را آپلود میکنند که انتظارش را نداشتیم؟ • دقت مدل: آیا هوش مصنوعی شروع به توهم (hallucinate) در مورد وسایلی کرده که کاربر اصلاً آنها را ندارد؟
۷. حلقه بازخورد (The Feedback Loop)
سیستم باید از اشتباهات خود درس بگیرد. ما اصلاحات کاربران را ثبت کرده و آن دادهها را به مرحله اول برمیگردانیم تا مدل را دوباره آموزش داده و بهبود بخشیم.
MLOps یک دموی جذاب را به یک ابزار حرفهای تبدیل میکند.
Source: https://dev.to/saad4software/mlops-for-llm-a-case-study-on-dresscode-3joj
Optional learning community: https://t.me/GyaanSetuAi
