自動化を隠すための投稿前QCゲートの構築方法

自動化には足跡が残る。

Blueskyのキューを運用し始めて3週間後、「the content pipeline(コンテンツ・パイプライン)」という言葉が含まれた投稿が流れるのを目の当たりにした。

技術ブログであれば、そのフレーズは問題ない。しかし、ソーシャルメディアのタイムラインでは、それはレッドフラッグ(警告信号)だ。人間の読者に対して、これはコンテンツファーム(自動生成サイト)であると告げているようなものだからだ。

私のシステムは機械的には動作していたが、フィルターがなかった。AIが生成したものはすべてそのままキューに送られ、キューの先頭にあるものがそのまま投稿されていた。

これを解決するために、bluesky-qc.mjs というゲートスクリプトを作成した。これは、生成ステップと投稿ステップの間にフィルターとして機能する。

4つのゲートの仕組みは以下の通りだ:

  • Gate 1: フレーズ検出。自動化の兆候を捉えるために、厳格な単語リストを使用している。「AI-generated」、「cron job」、「batch test」、「content pipeline」といった用語をブロックする。投稿がロボットによって書かれたように聞こえる場合、ゲートがそれを阻止する。

  • Gate 2: 鮮度チェック。これは2種類のエラーを防ぐ。第一に、「just released」のような、投稿が遅れると嘘になってしまう時間経過に敏感なフレーズを検知する。第二に、エントリーの経過時間をチェックする。エントリーが14日以上古い場合は、不合格となる。

  • Gate 3: エンゲージメント予測。このスクリプトは過去300件の投稿を分析する。いいね、返信、リポストを使用してベースラインのスコアを算出する。過去の傾向からパフォーマンスが低いことが分かっているハッシュタグが使用されている場合、システムがフラグを立てる。

  • Gate 4: 品質レビュー。これは、最終的な品質チェックのためにモデルを使用する予定のステップだ。

不合格となった投稿はすべて拒否ログ(rejection log)に送られる。私はこのログを毎週確認している。これがプロンプトを修正する助けになる。もしAIが「pipeline」のような専門用語を使い続けるなら、それを止めるようにプロンプトを更新する。

このシステムはシンプルなルールに従っている。早期にゲートを設け、失敗時には情報を得られるようにし、エラーを黙って握りつぶさないことだ。

自動化を露呈させてしまうような投稿をするくらいなら、投稿を一日休むほうがよい。

出典: https://dev.to/morinaga/how-i-built-a-pre-post-qc-gate-that-blocks-bluesky-automation-from-self-revealing-41ja

オプションの学習コミュニティ: https://t.me/GyaanSetuAi