தானியங்கி சமிக்ஞைகளை (Automation Signals) மறைக்க நான் ஒரு QC Gate-ஐ எவ்வாறு உருவாக்கினேன்
தானியங்கி முறைகள் (Automation) நீங்கள் எதிர்பார்க்காத வழிகளில் வெளிப்படும்.
நான் Bluesky-க்காக ஒரு தானியங்கி உள்ளடக்கப் பாதையை (automated content pipeline) இயக்கினேன். அதில் ஒரு பதிவு "the content pipeline" என்று குறிப்பிட்டது. ஒரு தொழில்நுட்ப வலைப்பதிவில் (technical blog) இது பரவாயில்லை. ஆனால் ஒரு சமூக காலவரிசையில் (social timeline), இது ஒரு எச்சரிக்கை அறிகுறி. வாசகர்கள் தாங்கள் ஒரு பாட் (bot) உடன் பேசிக்கொண்டிருக்கிறார்கள் என்பதை இது உணர்த்திவிடும்.
இதைத் தடுக்க நான் ஒரு தரக்கட்டுப்பாட்டு ஸ்கிரிப்டை (quality control script) உருவாக்கினேன். இது உள்ளடக்கத்தை உருவாக்கும் படிநிலைக்கும் (generation step), பதிவிடும் படிநிலைக்கும் (posting step) இடையில் ஒரு நுழைவாயிலாக (gate) செயல்படுகிறது.
புதிய பணிப்பாய்வு (workflow) இவ்வாறு அமையும்:
bluesky-qc.mjs → (PASS) bluesky-post-queue.mjs → Bluesky API
ஒவ்வொரு பதிவையும் சரிபார்க்க இந்த ஸ்கிரிப்ட் நான்கு நுழைவாயில்களைப் பயன்படுத்துகிறது:
Gate 1: சொற்றொடர் வடிகட்டுதல் (Phrase Filtering) தானியங்கி முறையைக் குறிக்கும் சொற்களைக் கண்டறிய நான் ஒரு regex பட்டியலைப் பயன்படுத்துகிறேன். இது "AI-generated," "cron," "content pipeline," அல்லது "batch test" போன்ற சொற்களைத் தடுக்கிறது. ஒரு பதிவு ஒரு டெவலப்பர் அறிக்கையைப் போலத் தோன்றினால், அது தோல்வியடையும்.
Gate 2: காலாவதி சரிபார்ப்பு (Staleness Checks) நான் இரண்டு வகையான காலாவதியான உள்ளடக்கங்களைச் சரிபார்க்கிறேன்: • காலாவதியான சொற்றொடர்கள் (Stale phrasing): பதிவு தாமதமானால் அர்த்தம் இழக்கும் "today" அல்லது "just launched" போன்ற சொற்களை இது கண்டறியும். • காலாவதியான நேர முத்திரைகள் (Stale timestamps): ஒரு பதிவு 14 நாட்களுக்கு மேல் பழமையானதாக இருந்தால், அது நிராகரிக்கப்படும்.
Gate 3: ஈடுபாட்டுக் கணிப்பு (Engagement Prediction) இந்த ஸ்கிரிப்ட் எனது கடந்த 300 பதிவுகளைப் பார்க்கிறது. ஒரு புதிய பதிவில் உள்ள ஹேஷ்டேக்குகள் (hashtags) சிறப்பாகச் செயல்படுமா என்பதைக் கணிக்கிறது. தற்போது, இது ஒரு எச்சரிக்கையை மட்டுமே பதிவு செய்கிறது, ஆனால் விரைவில் இதை ஒரு கட்டாயத் தோல்வியாக (hard fail) மாற்றப் போகிறேன்.
Gate 4: தரச் சரிபார்ப்பு (Quality Pass - திட்டமிடப்பட்டுள்ளது) நுணுக்கமான பிழைகளைக் கண்டறிய ஒரு தரக் கட்டுப்பாட்டு நெறிமுறையைப் (quality protocol) பயன்படுத்தி ஒரு இறுதி அடுக்கைச் சேர்க்கத் திட்டமிட்டுள்ளேன்.
ஒவ்வொரு தோல்வியும் ஒரு நிராகரிப்புப் பதிவேட்டில் (rejection log) சேமிக்கப்படுகிறது. நான் வாரத்திற்கு ஒருமுறை இந்தத் தொகுப்பை ஆய்வு செய்கிறேன். இது எனது ப்ராம்ப்ட்களை (prompts) சரிசெய்ய உதவுகிறது. நுழைவாயில் தொடர்ந்து "content pipeline" என்பதைக் கண்டறிந்து கொண்டே இருந்தால், AI எழுதும் முறையை நான் மாற்ற வேண்டும் என்பதை நான் உணர்ந்து கொள்வேன்.
வெறும் சிறந்த ப்ராம்ப்ட்களைப் பயன்படுத்துவதற்குப் பதிலாக ஏன் ஒரு நுழைவாயிலைப் (gate) பயன்படுத்த வேண்டும்? ப்ராம்ப்ட்கள் நிகழ்தகவு சார்ந்தவை (probabilistic). அவை தோல்வியடையக்கூடும். ஒரு நுழைவாயில் என்பது தீர்மானிக்கப்பட்டது (deterministic). அது கடுமையான விதிகளைப் பின்பற்றுகிறது.
மனிதத் தன்மையுடன் கூடிய தொனியைப் பராமரிக்க இந்த இரண்டு அடுக்குகளையும் பயன்படுத்துவதே பாதுகாப்பான வழியாகும்.
