چگونه یک دروازه کنترل کیفیت پیش و پس از انتشار برای پنهان کردن اتوماسیون ساختم

اتوماسیون ردپا به جا می‌گذارد.

سه هفته پس از شروع اجرای صف Bluesky، متوجه شدم پستی منتشر شده که در آن به «خط تولید محتوا» اشاره شده است.

در یک وبلاگ فنی، این عبارت مشکلی ندارد. اما در تایم‌لاین شبکه‌های اجتماعی، یک زنگ خطر است. این عبارت به خوانندگان انسانی می‌گوید که آن‌ها در حال تماشای یک مزرعه محتوا (content farm) هستند.

سیستم من از نظر مکانیکی کار می‌کرد، اما فیلتری نداشت. هر آنچه هوش مصنوعی تولید می‌کرد مستقیماً به صف می‌رفت. هر آنچه در ابتدای صف بود، منتشر می‌شد.

من برای رفع این مشکل، یک اسکریپت دروازه به نام bluesky-qc.mjs ساختم. این اسکریپت به عنوان یک فیلتر بین مرحله تولید و مرحله انتشار عمل می‌کند.

نحوه عملکرد این چهار دروازه به شرح زیر است:

  • دروازه ۱: تشخیص عبارت. من از یک لیست سخت‌گیرانه از کلمات برای شناسایی نشانه‌های اتوماسیون استفاده می‌کنم. این مرحله عباراتی مانند 'AI-generated'، 'cron job'، 'batch test' و 'content pipeline' را مسدود می‌کند. اگر پستی طوری به نظر برسد که انگار یک ربات آن را نوشته است، دروازه جلوی آن را می‌گیرد.

  • دروازه ۲: بررسی تازگی. این مرحله از دو نوع خطا جلوگیری می‌کند. اول، عبارات حساس به زمان مانند 'just released' را شناسایی می‌کند که اگر انتشار پست با تأخیر مواجه شود، به دروغ تبدیل می‌شوند. دوم، قدمت ورودی را بررسی می‌کند. اگر ورودی قدیمی‌تر از ۱۴ روز باشد، رد می‌شود.

  • دروازه ۳: پیش‌بینی تعامل. این اسکریپت ۳۰۰ پست اخیر من را بررسی می‌کند. یک امتیاز پایه با استفاده از لایک‌ها، پاسخ‌ها و بازنشرها محاسبه می‌کند. اگر پستی از هشتگ‌هایی استفاده کند که از نظر تاریخی عملکرد ضعیفی داشته‌اند، سیستم آن را علامت‌گذاری می‌کند.

  • دروازه ۴: بازبینی کیفیت. این یک مرحله برنامه‌ریزی شده برای استفاده از یک مدل جهت بررسی نهایی کیفیت است.

هر پست رد شده به یک گزارش رد (rejection log) منتقل می‌شود. من این گزارش را هفتگی بررسی می‌کنم. این کار به من کمک می‌کند تا پرامپت‌هایم را اصلاح کنم. اگر هوش مصنوعی همچنان از اصطلاحات فنی مثل 'pipeline' استفاده کند، پرامپت را به‌روزرسانی می‌کنم تا جلوی آن را بگیرم.

سیستم از یک قاعده ساده پیروی می‌کند: زودتر فیلتر کن، شکست‌ها را آموزنده کن و هرگز خطاها را بی‌صدا نادیده نگیر.

بهتر است یک روز از پست گذاشتن صرف‌نظر کرد تا اینکه چیزی منتشر کرد که ماهیت اتوماسیون را فاش کند.

منبع: https://dev.to/morinaga/how-i-built-a-pre-post-qc-gate-that-blocks-bluesky-automation-from-self-revealing-41ja

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi