MLOps برای LLM: مطالعه موردی Dresscode

گذار از یک اثبات مفهوم (PoC) به یک محصول واقعی دشوار است.

من Dresscode را ساختم، یک استایلیست هوش مصنوعی. این برنامه از Gemma 4 برای دیجیتالی کردن کمد لباس و پیشنهاد ست‌های پوشاک بر اساس وضعیت آب‌وهوای لحظه‌ای استفاده می‌کند.

یک ایده عالی به چیزی فراتر از یک مدل نیاز دارد؛ به MLOps نیاز دارد.

MLOps باعث می‌شود هوش مصنوعی شما دقیق، قابل اعتماد و از نظر هزینه مقرون‌به‌صرفه باقی بماند. در اینجا خط لوله (pipeline) ۷ مرحله‌ای که برای مقیاس‌پذیری هوش مصنوعی استفاده می‌کنم، آورده شده است.

۱. جذب و مهندسی داده‌ها (Data Ingestion and Engineering)

داده‌های خام نامنظم هستند. در Dresscode، کاربران عکس‌هایی با کیفیت بالا آپلود می‌کنند. • جذب (Ingestion): ما عکس‌ها را از طریق API به فضای ذخیره‌سازی ابری منتقل می‌کنیم. • مهندسی (Engineering): ما عکس‌های ۱۲ مگابایتی گوشی‌های هوشمند را فشرده می‌کنیم تا در هزینه‌ها صرفه‌جویی کرده و سرعت پردازش را بالا ببریم. همچنین برای حفظ حریم خصوصی، متادیتاها (metadata) را حذف می‌کنیم. • پاکسازی متن (Text Cleaning): ما داده‌های API آب‌وهوا را پاکسازی می‌کنیم تا پرامپت‌ها (prompts) کوتاه و کارآمد باقی بمانند.

۲. ذخیره‌ساز ویژگی (Feature Store)

ویژگی‌ها (Features) جزئیات خاصی هستند که هوش مصنوعی برای تصمیم‌گیری از آن‌ها استفاده می‌کند. • برای تصاویر: ما امبدینگ‌های ریاضی (embeddings/vectors) را ذخیره می‌کنیم. این کار از پردازش مجدد یک تصویر جلوگیری می‌کند. • برای آب‌وهوا: ما داده‌های خام را به دسته‌هایی مانند «سرد» یا «بارانی» تبدیل می‌کنیم. • مزیت: یک Feature Store به شما اجازه می‌دهد به جای محاسبه مجدد، این جزئیات را فوراً فراخوانی کنید.

۳. آموزش مدل و آزمایش (Model Training and Experimentation)

ما Gemma 4 را از صفر آموزش نمی‌دهیم. تمرکز ما بر مهندسی پرامپت (Prompt Engineering) و ارزیابی است. • آزمایش (Experimentation): ما پرامپت‌های سیستمی مختلف را تست می‌کنیم تا مطمئن شویم هوش مصنوعی خروجی JSON تمیزی تولید می‌کند. • یکپارچه‌سازی مداوم (CI): ما از یک «مجموعه داده طلایی» (Golden Dataset) شامل ۱۰۰ عکس استفاده می‌کنیم. هر بار که پرامپتی را تغییر می‌دهیم، سیستم بررسی می‌کند که آیا دقت بالای ۹۵٪ باقی می‌ماند یا خیر.

۴. ثبت مدل (Model Registry)

این را مانند یک اپ‌استور برای مدل‌های خود تصور کنید. • ما پرامپت‌ها و پیکربندی‌های مدل را با نسخه‌بندی ذخیره می‌کنیم. • اگر یک پرامپت جدید باعث شود هوش مصنوعی در تابستان کت پیشنهاد دهد، می‌توانیم با کلیک روی "Rollback" فوراً به یک نسخه پایدار بازگردیم.

۵. استقرار و سرویس‌دهی مداوم (Continuous Deployment and Serving)

این روشی است که مدل را به دست کاربر می‌رسانید. • وظایف بصری (Visual Tasks): ما از صف‌های ناهمگام (asynchronous queues) استفاده می‌کنیم. کاربران عکس‌ها را آپلود می‌کنند و ما آن‌ها را در پس‌زمینه پردازش می‌کنیم تا سرعت اپلیکیشن حفظ شود. • وظایف متنی (Text Tasks): ما از استریم کردن توکن‌ها (token streaming) استفاده می‌کنیم. این کار پیشنهاد ست پوشاک را کلمه به کلمه نمایش می‌دهد تا کاربر منتظر صفحه بارگذاری نماند.

۶. نظارت مداوم (Continuous Monitoring)

عملکرد هوش مصنوعی می‌تواند با گذشت زمان کاهش یابد. ما سه مورد را زیر نظر می‌گیریم: • عملکرد سیستم: آیا تأخیر (latency) در حال افزایش است؟ • تغییر توزیع داده‌ها (Data Drift): آیا کاربران فرمت‌های جدیدی از عکس را آپلود می‌کنند که انتظارش را نداشتیم؟ • دقت مدل: آیا هوش مصنوعی شروع به توهم (hallucinate) در مورد وسایلی کرده که کاربر اصلاً آن‌ها را ندارد؟

۷. حلقه بازخورد (The Feedback Loop)

سیستم باید از اشتباهات خود درس بگیرد. ما اصلاحات کاربران را ثبت کرده و آن داده‌ها را به مرحله اول برمی‌گردانیم تا مدل را دوباره آموزش داده و بهبود بخشیم.

MLOps یک دموی جذاب را به یک ابزار حرفه‌ای تبدیل می‌کند.

Source: https://dev.to/saad4software/mlops-for-llm-a-case-study-on-dresscode-3joj

Optional learning community: https://t.me/GyaanSetuAi