मी ऑटोमेशन सिग्नल लपवण्यासाठी QC गेट कसे तयार केले
ऑटोमेशन अशा प्रकारे स्वतःला प्रकट करते ज्याची तुम्हाला अपेक्षा नसते.
मी Bluesky साठी एक ऑटोमेटेड कंटेंट पाईपलाईन चालवत होतो. एक पोस्ट बाहेर गेली ज्यामध्ये "the content pipeline" असा उल्लेख होता. तांत्रिक ब्लॉगवर हे ठीक आहे. पण सोशल टाइमलाइनवर, हे एक 'रेड फ्लॅग' आहे. ते वाचकांना सांगते की ते एका बॉटशी बोलत आहेत.
हे थांबवण्यासाठी मी एक क्वालिटी कंट्रोल (QC) स्क्रिप्ट तयार केली. हे जनरेशन स्टेप आणि पोस्टिंग स्टेप यांच्यामध्ये एका गेटप्रमाणे काम करते.
नवीन वर्कफ्लो असा दिसतो: bluesky-qc.mjs → (PASS) bluesky-post-queue.mjs → Bluesky API
स्क्रिप्ट प्रत्येक एन्ट्री तपासण्यासाठी चार गेट्सचा वापर करते:
गेट १: फ्रेज फिल्टरिंग (Phrase Filtering) ऑटोमेशनचे संकेत देणारे शब्द पकडण्यासाठी मी regex लिस्ट वापरतो. हे "AI-generated," "cron," "content pipeline," किंवा "batch test" सारखे शब्द ब्लॉक करते. जर एखादी पोस्ट डेव्हलपमेंट रिपोर्टसारखी वाटली, तर ती नाकारली जाते.
गेट २: स्टेलनेस चेक (Staleness Checks) मी दोन प्रकारच्या जुन्या (stale) कंटेंटची तपासणी करतो: • स्टेल फ्रेझिंग (Stale phrasing): हे "today" किंवा "just launched" सारखे शब्द पकडते, ज्यांचा अर्थ पोस्ट उशिरा गेल्यास बदलतो. • स्टेल टाइमस्टॅम्प्स (Stale timestamps): जर एखादी एन्ट्री १४ दिवसांपेक्षा जुनी असेल, तर ती रिजेक्ट केली जाते.
गेट ३: एंगेजमेंट प्रेडिक्शन (Engagement Prediction) स्क्रिप्ट माझ्या मागील ३०० पोस्ट्स पाहते. नवीन पोस्टमधील हॅशटॅग्स चांगले काम करतील का, याचे ते भाकीत करते. सध्या, हे फक्त एक वॉर्निंग लॉग करते, पण मी लवकरच याचे रूपांतर 'हार्ड फेल' (hard fail) मध्ये करणार आहे.
गेट ४: क्वालिटी पास (Quality Pass) (नियोजित) सूक्ष्म चुका पकडण्यासाठी मी क्वालिटी प्रोटोकॉल वापरून एक अंतिम स्तर जोडण्याचा विचार करत आहे.
प्रत्येक अपयश रिजेक्शन लॉगमध्ये (rejection log) जाते. मी आठवड्यातून एकदा या लॉगचे पुनरावलोकन करतो. यामुळे मला माझे प्रॉम्प्ट्स (prompts) सुधारण्यास मदत होते. जर गेट वारंवार "content pipeline" पकडत असेल, तर मला समजते की AI कशा प्रकारे लिहितो यात मला बदल करण्याची गरज आहे.
फक्त चांगले प्रॉम्प्ट्स वापरण्याऐवजी गेट का वापरावे? प्रॉम्प्ट्स हे प्रोबॅबिलिस्टिक (probabilistic) असतात. ते अपयशी ठरू शकतात. गेट हे डिटरमिनिस्टिक (deterministic) असते. ते कडक नियमांचे पालन करते.
मानवी टोन (human tone) टिकवून ठेवण्यासाठी दोन्ही स्तर वापरणे हा सर्वात सुरक्षित मार्ग आहे.
