چگونگی طراحی سیستم‌های هوش مصنوعی توسط OpenAI و Anthropic

بسیاری از افراد سعی می‌کنند با بررسی مستندات API یا پست‌های وبلاگ، شرکت‌های هوش مصنوعی را مهندسی معکوس کنند. آن‌ها بر مدل‌ها یا نقاط پایانی (endpoints) تمرکز می‌کنند. این کار منجر به نتایج اشتباه می‌شود.

OpenAI و Anthropic فقط مدل نمی‌سازند؛ آن‌ها کل یک اکوسیستم را می‌سازند.

یک سیستم هوش مصنوعی در مرحله تولید (production)، یک سیستم توزیع‌شده در مقیاس بزرگ است. این یک معماری لایه‌بندی شده است که در آن هر بخش بر بخش‌های دیگر تأثیر می‌گذارد.

اگر به هوش مصنوعی به عنوان یک مؤلفه واحد نگاه کنید، بخش اصلی کار را نادیده گرفته‌اید. جادو در نحوه تعامل این لایه‌ها نهفته است.

در اینجا لایه‌های اصلی یک سیستم هوش مصنوعی در مقیاس بزرگ آورده شده است:

• خط لوله داده (Data Pipeline): جمع‌آوری و پاکسازی داده‌های آموزشی. • زیرساخت آموزش (Training Infrastructure): مدیریت محاسبات عظیم و خوشه‌های GPU. • لایه مدل (Model Layer): معماری اصلی LLM. • لایه استنتاج (Inference Layer): ارائه پاسخ‌ها به کاربران با تأخیر (latency) کم. • لایه ایمنی (Safety Layer): اعمال محدودیت‌ها (guardrails) و هم‌ترازی (alignment). • مشاهده‌پذیری (Observability): نظارت بر عملکرد و ردیابی خطاها. • حلقه بازخورد (Feedback Loop): استفاده از داده‌های جدید برای بهبود مدل در طول زمان.

مدل تنها یکی از بخش‌های این شبکه است.

برای مثال، هم‌ترازی (alignment) یک کار یک‌باره نیست. شرکت‌ها از استراتژی‌های مختلفی برای ایمن نگه داشتن مدل‌ها استفاده می‌کنند:

  • RLHF: استفاده از بازخورد انسانی برای هدایت رفتار.
  • Constitutional AI: استفاده از راهنمایی‌های مبتنی بر قانون برای مقیاس‌پذیری.
  • فیلترینگ خروجی (Output Filtering): استفاده از پس‌پردازش برای مسدود کردن محتوای نامناسب.

وقتی مدل آماده شد، چالش به سمت استنتاج (inference) تغییر می‌کند. شما باید بین سرعت و هزینه تعادل برقرار کنید. مهندسان از تکنیک‌هایی مانند دسته‌بندی (batching)، حافظه پنهان (caching) و کوانتیزاسیون (quantization) استفاده می‌کنند تا سیستم‌ها را سریع و قابل اعتماد نگه دارند.

مقیاس‌بندی این سیستم‌ها دشوار است. این کار فقط به معنای اضافه کردن سخت‌افزار بیشتر نیست، بلکه به معنای مدیریت پیچیدگی است. با مقیاس‌بندی، با مسائل جدیدی در زمینه هماهنگی و قابلیت اطمینان روبرو می‌شوید.

موفقیت از نگاه کردن به هوش مصنوعی به عنوان یک سیستم در حال تکامل حاصل می‌شود. این شرکت‌ها محصولات ایستا نمی‌سازند؛ آن‌ها حلقه‌هایی می‌سازند که از استفاده در دنیای واقعی یاد می‌گیرند.

از نگاه کردن به مدل به صورت مجزا دست بردارید. به کل سیستم نگاه کنید.

منبع: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537