ساخت ماژول‌های هوش مصنوعی اتاق خبر در PHP

بسیاری از مردم تصور می‌کنند هوش مصنوعی در یک اتاق خبر به معنای یک جعبه چت بزرگ است. این یک اشتباه است. این مدل منجر به ویژگی‌هایی می‌شود که مردم یک بار از آن‌ها استفاده می‌کنند و سپس نادیده‌شان می‌گیرند.

یک اتاق خبر ده‌ها نیاز کوچک و خاص دارد. شما به گزینه‌های تیتر نیاز دارید. به متن‌های کوتاه برای شبکه‌های اجتماعی نیاز دارید. به عناوین سئو نیاز دارید. به برچسب‌گذاری موجودیت‌ها (entity tagging) نیاز دارید. هر وظیفه کوچک است اما قوانین خاص خود را دارد.

پس از کار با ۲۰۰ سایت خبری، راه درست ساخت این سیستم را پیدا کردم. یک «ویژگی هوش مصنوعی» واحد نسازید. مجموعه‌ای از جریان‌های کاری (workflows) کوچک و تخصصی بسازید.

روش انجام آن در PHP به این صورت است:

  • از «وظایف» (tasks)، نه «پرامپت‌ها» (prompts) استفاده کنید. یک وظیفه، واحدی نام‌گذاری شده با یک قرارداد ثابت است. این واحد می‌داند چه چیزی نیاز دارد و چه چیزی برمی‌گرداند.
  • خروجی را درون خودِ وظیفه اعتبارسنجی کنید. مدل‌ها اغلب زمانی که شما JSON می‌خواهید، متن برمی‌گردانند. اگر وظیفه خروجی خودش را اعتبارسنجی کند، می‌توانید بدون از کار افتادن ویرایشگر، دوباره تلاش کنید یا با مدیریت خطا، فرآیند را متوقف کنید.
  • از یک مسیریاب مبتنی بر سطح (tier-based router) استفاده کنید. وظایف ساده را روی مدل‌های ارزان اجرا کنید. وظایف حقوقی یا مربوط به ریسک را روی مدل‌های پرمیوم اجرا کنید.
  • بر اساس وظیفه و ورودی، کش (cache) کنید. اگر یک ویرایشگر دو بار روی دکمه یک مقاله مشابه کلیک کرد، نباید هزینه دومین فراخوانی هوش مصنوعی را بپردازید. کش کردن بهترین راه کنترل هزینه شماست.
  • قوانین را در کد و سلیقه را در پرامپت‌ها نگه دارید. از مدل نخواهید که چک کند آیا تیتر زیر ۷۰ کاراکتر است یا خیر؛ برای این کار از PHP استفاده کنید. از مدل برای تصمیم‌گیری در مورد خوب بودن تیتر استفاده کنید. کد قوانین را مدیریت می‌کند و مدل‌ها قضاوت را.

وظایف خود را برای سازماندهی بهتر گروه‌بندی کنید:

• تیترها: عناوین سئو، متن‌های کوتاه شبکه‌های اجتماعی، نوتیفیکیشن‌های Push. • ساختار: خلاصه‌ها، نکات کلیدی، پیشنهادهای «بیشتر بخوانید». • طبقه‌بندی: پیشنهادهای دسته‌بندی، استخراج برچسب‌ها. • رسانه: متن جایگزین (Alt text)، کپشن‌ها، راهنمای برش (crop hints). • کیفیت: بررسی لحن، نشانه‌گذاری ریسک، فیلترهای کلمات رکیک.

هدف، قابلیت اطمینان عملیاتی است. اگر یک ارائه‌دهنده هوش مصنوعی در یک روز شلوغ خبری از دسترس خارج شد، شما باید یک فایل تنظیمات (config) را تغییر دهید، نه اینکه کد خود را بازنویسی کنید.

دو قانون نهایی برای موفقیت:

  1. پیشنهادها فقط پیش‌نویس هستند. هرگز اجازه ندهید هوش مصنوعی مستقیماً در یک فیلد منتشرشده بنویسد. یک انسان همیشه باید خروجی را بازبینی و تایید کند.
  2. در پس‌زمینه کار کنید. اگر یک وظیفه بیش از یک ثانیه طول می‌کشد، آن را به عنوان یک کار ناهمگام (async job) اجرا کنید. اجازه ندهید ویرایشگران شما منتظر صفحه بارگذاری (loading screen) بمانند.

ابتدا معماری را بسازید. مدل در اولویت دوم قرار دارد.

Source: https://dev.to/mahmut_gndzalp_c736ac4b/building-newsroom-ai-modules-in-php-50-specialized-workflows-2co1