كيف تصمم OpenAI وAnthropic أنظمة الذكاء الاصطناعي

يحاول الكثير من الناس إجراء هندسة عكسية لشركات الذكاء الاصطناعي من خلال الاطلاع على وثائق الـ API أو تدوينات المواقع. إنهم يركزون على النماذج ونقاط النهاية (endpoints)، وهذا يؤدي إلى استنتاجات خاطئة.

النموذج ليس سوى جزء واحد من اللغز.

شركات مثل OpenAI وAnthropic لا تبني النماذج فحسب، بل تبني أنظمة بيئية ضخمة، وتبني أنظمة موزعة واسعة النطاق.

إذا كنت تعتقد أن لديهم نماذج أفضل فحسب، فقد فاتك السر الحقيقي. إن نجاحهم يأتي من كيفية تدريب تلك النماذج ونشرها وتحسينها من خلال حلقات متكاملة.

يتطلب نظام ذكاء اصطناعي في مرحلة الإنتاج بهذا النطاق عدة طبقات:

• خطوط أنابيب البيانات (Data Pipelines): لجمع وتنظيف بيانات التدريب. • البنية التحتية للتدريب (Training Infrastructure): لإدارة تكاليف الحوسبة الهائلة والتوازي (parallelism). • طبقة النموذج (Model Layer): البنية الأساسية لتحقيق الدقة. • طبقة الاستدلال (Inference Layer): لتقديم الاستجابات بزمن انتقال منخفض. • طبقة الأمان (Safety Layer): لفرض الضوابط والمواءمة (alignment). • القابلية للملاحظة (Observability): لمراقبة الأداء وتصحيح الأخطاء. • حلقات التغذية الراجعة (Feedback Loops): لتحسين النموذج بمرور الوقت.

تعتمد كل طبقة على الطبقات الأخرى. إذا قمت بتغيير طبقة واحدة، فستؤثر على النظام بأكمله.

التدريب هو أيضاً عملية مستمرة. هذه الشركات لا تدرب النموذج مرة واحدة ثم تتوقف، بل تستخدم نموذج تدريب مستمر. إنهم يستخدمون آلاف وحدات معالجة الرسومات (GPUs) للتعامل مع التدفقات المستمرة من البيانات الجديدة.

تُعد المواءمة (Alignment) والأمان أيضاً ركيزتين أساسيتين في تصميمها. وهي تستخدم استراتيجيات مختلفة لتوجيه سلوك النموذج:

• RLHF: يستخدم التغذية الراجعة البشرية لتحقيق مواءمة عالية الجودة. • Constitutional AI: يستخدم التوجيه القائم على القواعد لتحقيق النطاق المطلوب. • قيود الأوامر (Prompt Constraints): يستخدم تعليمات النظام للإعداد السريع. • تصفية المخرجات (Output Filtering): يستخدم المعالجة اللاحقة للإشراف.

إنهم يجمعون بين هذه الأساليب للحفاظ على القوة والمتانة.

بمجرد أن يصبح النموذج جاهزاً، يجب عليهم تقديمه (serve). يستخدمون تقنيات مثل المعالجة بالدفعات (batching)، والتخزين المؤقت (caching)، والتكميم (quantization). تساعد هذه التقنيات في إدارة المقايضة بين السرعة والتكلفة.

أخيراً، يستخدمون القابلية للملاحظة (observability) لرؤية كل شيء. ولأن مخرجات الذكاء الاصطناعي ليست متطابقة دائماً، فإن تصحيح الأخطاء يكون صعباً. لا يمكنك مجرد النظر إلى خطأ واحد، بل يجب عليك النظر إلى الأنماط عبر النظام بأكمله.

يأتي النجاح في مجال الذكاء الاصطناعي من إدارة هذه التفاعلات المعقدة. إنهم يتعاملون مع الذكاء الاصطناعي كنظام متطور، وليس كمنتج ثابت.

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

Optional learning community: https://t.me/GyaanSetuAi