MLOps لنماذج اللغة الكبيرة (LLM): دراسة حالة حول Dresscode

الانتقال من مرحلة إثبات المفهوم إلى منتج حقيقي أمر صعب.

لقد قمت ببناء Dresscode، وهو منسق أزياء يعمل بالذكاء الاصطناعي. يستخدم Gemma 4 لرقمنة خزانة الملابس واقتراح أطقم ملابس بناءً على حالة الطقس في الوقت الفعلي.

الفكرة العظيمة تحتاج إلى ما هو أكثر من مجرد نموذج؛ إنها تحتاج إلى MLOps.

تحافظ MLOps على دقة الذكاء الاصطناعي الخاص بك، وموثوقيته، وتكلفة تشغيله المنخفضة. إليك خط سير العمل المكون من 7 خطوات الذي أستخدمه لتوسيع نطاق الذكاء الاصطناعي.

1. استيعاب البيانات وهندستها (Data Ingestion and Engineering)

البيانات الخام غير منظمة. بالنسبة لـ Dresscode، يقوم المستخدمون بتحميل صور عالية الدقة. • الاستيعاب (Ingestion): نقوم بنقل الصور إلى التخزين السحابي عبر API. • الهندسة (Engineering): نقوم بضغط صور الهواتف الذكية التي يبلغ حجمها 12 ميجابايت لتوفير التكاليف وتسريع المعالجة. كما نقوم بإزالة البيانات الوصفية (metadata) للحفاظ على الخصوصية. • تنظيف النصوص (Text Cleaning): نقوم بتنظيف بيانات weather API للحفاظ على قصر وكفاءة الأوامر (prompts).

2. مخزن الميزات (Feature Store)

الميزات (Features) هي التفاصيل المحددة التي يستخدمها الذكاء الاصطناعي لاتخاذ القرارات. • بالنسبة للصور: نقوم بتخزين التضمينات الرياضية (embeddings/vectors). هذا يمنعنا من إعادة معالجة نفس الصورة مرتين. • بالنسبة للطقس: نقوم بتحويل البيانات الخام إلى فئات مثل "بارد" أو "ممطر". • الفائدة: يتيح لك مخزن الميزات (Feature Store) سحب هذه التفاصيل فوراً بدلاً من إعادة حسابها.

3. تدريب النموذج والتجريب (Model Training and Experimentation)

نحن لا نقوم بتدريب Gemma 4 من الصفر، بل نركز على هندسة الأوامر (Prompt Engineering) والتقييم. • التجريب (Experimentation): نختبر أوامر نظام (system prompts) مختلفة لضمان إخراج الذكاء الاصطناعي لبيانات JSON نظيفة. • التكامل المستمر (CI): نستخدم "مجموعة بيانات ذهبية" (Golden Dataset) مكونة من 100 صورة. في كل مرة نغير فيها أمراً (prompt)، يتحقق النظام مما إذا كانت الدقة تظل فوق 95%.

4. سجل النماذج (Model Registry)

فكر في هذا كمتجر تطبيقات لنماذجك. • نقوم بتخزين الأوامر (prompts) وإعدادات النماذج مع إصداراتها (versioned). • إذا تسبب أمر جديد في توصية الذكاء الاصطناعي بمعطف في الصيف، يمكننا النقر على "Rollback" للعودة إلى نسخة مستقرة فوراً.

5. النشر والخدمة المستمرة (Continuous Deployment and Serving)

هذه هي الطريقة التي توصل بها النموذج إلى المستخدم. • المهام المرئية: نستخدم طوابير غير متزامنة (asynchronous queues). يقوم المستخدمون بتحميل الصور، ونقوم بمعالجتها في الخلفية ليبقى التطبيق سريعاً. • المهام النصية: نستخدم تدفق الرموز (token streaming). هذا يعرض اقتراح الزي كلمة بكلمة حتى لا يضطر المستخدم للانتظار أمام شاشة التحميل.

6. المراقبة المستمرة (Continuous Monitoring)

يمكن لأداء الذكاء الاصطناعي أن يتراجع بمرور الوقت. نحن نراقب ثلاثة أشياء: • أداء النظام: هل يزداد زمن الاستجابة (latency)؟ • انحراف البيانات (Data Drift): هل يقوم المستخدمون بتحميل تنسيقات صور جديدة لم نتوقعها؟ • دقة النموذج: هل بدأ الذكاء الاصطناعي في "الهلوسة" (hallucinate) واقتراح قطع لا يملكها المستخدم؟

7. حلقة التغذية الراجعة (The Feedback Loop)

يجب أن يتعلم النظام من أخطائه. نقوم بالتقاط تصحيحات المستخدمين وإعادة تغذية تلك البيانات في الخطوة الأولى لإعادة تدريب النموذج وتحسينه.

تحول MLOps العرض التجريبي الرائع إلى أداة احترافية.

المصدر: https://dev.to/saad4software/mlops-for-llm-a-case-study-on-dresscode-3joj

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi