Как я создал систему контроля качества перед публикацией, чтобы скрыть автоматизацию

Автоматизация оставляет следы.

Спустя три недели работы очереди в Bluesky я заметил, что вышел пост, в котором упоминался «контентный конвейер» (content pipeline).

В техническом блоге эта фраза уместна. В ленте соцсети это тревожный сигнал. Она дает живым читателям понять, что они смотрят на «ферму контента».

Моя система работала механически, но у нее не было фильтра. Все, что генерировал ИИ, сразу попадало в очередь. Все, что оказывалось в начале очереди, публиковалось.

Чтобы это исправить, я написал скрипт-фильтр под названием bluesky-qc.mjs. Он служит промежуточным звеном между этапом генерации и этапом публикации.

Вот как работают четыре этапа проверки:

  • Этап 1: Обнаружение фраз. Я использую строгий список слов для выявления признаков автоматизации. Он блокирует такие термины, как «AI-generated», «cron job», «batch test» и «content pipeline». Если пост звучит так, будто его написал робот, система его останавливает.

  • Этап 2: Проверка актуальности. Это предотвращает два типа ошибок. Во-первых, это отсеивает фразы, привязанные ко времени, такие как «just released», которые становятся ложью, если публикация задерживается. Во-вторых, проверяется возраст записи. Если записи больше 14 дней, она отклоняется.

  • Этап 3: Прогнозирование вовлеченности. Этот скрипт анализирует мои последние 300 постов. Он рассчитывает базовый показатель, используя лайки, ответы и репосты. Если в посте используются хэштеги, которые исторически показывают плохие результаты, система помечает его.

  • Этап 4: Проверка качества. Это запланированный шаг по использованию модели для финального контроля качества.

Каждый отклоненный пост попадает в лог отказов. Я проверяю этот лог еженедельно. Это помогает мне улучшать промпты. Если ИИ продолжает использовать жаргон вроде «pipeline», я обновляю промпт, чтобы это прекратить.

Система следует простому правилу: проверяй на ранних этапах, делай ошибки информативными и никогда не скрывай ошибки молча.

Лучше пропустить день публикаций, чем выложить что-то, что выдаст автоматизацию.

Source: https://dev.to/morinaga/how-i-built-a-pre-post-qc-gate-that-blocks-bluesky-automation-from-self-revealing-41ja

Optional learning community: https://t.me/GyaanSetuAi