ما تعلمته من بناء محتوى يعتمد على نوع خط المعالجة (Pipeline-Aware) في Astro
يمكنك إنشاء محتوى مخصص لأنواع النماذج المختلفة دون الحاجة لاستدعاء واجهة برمجة تطبيقات (API) للذكاء الاصطناعي عند كل عرض للصفحة.
قمت ببناء دليل لأدوات الذكاء الاصطناعي باستخدام Astro. في البداية، كانت جميع صفحات النماذج تبدو متشابهة؛ كانت الملخصات فريدة، لكن أقسام التوجيه كانت عامة. فكانت صفحة نموذج صوتي وصفحة نموذج نصي تعرضان نفس النص التجريبي الفارغ.
هذا أمر سيء للمستخدمين، كما أنه سيء لتحسين محركات البحث (SEO).
حللت هذه المشكلة باستخدام حقل بيانات وصفية (metadata) واحد من HuggingFace وهو: pipeline_tag.
إليكم آلية عمل النظام:
- تخزين البيانات: تقوم عملية ETL الخاصة بي بحفظ
pipeline_tagفي قاعدة البيانات أثناء خطوة الجلب (fetch). - منطق وقت البناء (Build Time): يقوم Astro بتحميل هذا الوسم أثناء عملية توليد الموقع الثابت (static site generation).
- مسارات اتخاذ القرار: أستخدم كوداً بسيطاً للتحقق من الوسم. إذا كان الوسم "text-generation"، تعرض الصفحة نصائح حول النماذج اللغوية الكبيرة (LLM). وإذا كان "audio"، تعرض نصائح حول الكلام.
- تكلفة تشغيل صفرية: كل هذا المنطق يحدث أثناء عملية البناء. يتلقى المستخدم ملف HTML بسيط، ولا توجد استدعاءات لـ API أو معالجة إضافية عند زيارة الموقع.
استخدمت هذه البيانات أيضاً لإنشاء إشارات أفضل لسهولة الاستخدام:
• مستويات التحميل: بدلاً من مجرد عرض رقم، أقوم بتصنيف النماذج إلى "راسخة" (established)، أو "مستخدمة بنشاط" (actively-used)، أو "متخصصة" (niche). وهذا يخبر المستخدم ما إذا كان سيجد دعماً من المجتمع أم لا. • روابط التسويق بالعمولة ذات الصلة: تعرض صفحات الـ LLM روابط لتأجير وحدات معالجة الرسومات (GPU). بينما تعرض صفحات التضمين (Embedding) روابط مختلفة وأكثر صلة. • التحكم في الفهرسة: إذا كان النموذج يحتوي على بيانات ضعيفة أو وسوم مفقودة، أستخدم وسم "noindex". هذا يمنع الصفحات منخفضة الجودة من الظهور في نتائج بحث Google.
المقايضات (Trade-offs):
- وسوم غير دقيقة: يقوم بعض المؤلفين بوسم النماذج بشكل غير صحيح. أتعامل مع هذا من خلال العودة إلى التوجيهات العامة كخيار احتياطي.
- تعقيد الكود: أصبح مكون الصفحة (page component) أطول الآن. أخطط لإعادة هيكلة هذا الكود (refactor) إلى وظائف مساعدة (helper functions) مع نمو المشروع.
النتيجة هي موقع يشعر المستخدم بأنه مصمم خصيصاً له، دون التكلفة الباهظة لتوليد المحتوى بالذكاء الاصطناعي في الوقت الفعلي.