PHP में न्यूज़रूम AI मॉड्यूल बनाना
अधिकांश लोगों को लगता है कि न्यूज़रूम में AI का मतलब एक बड़ा चैट बॉक्स है। यह एक गलती है। इस मॉडल से ऐसे फीचर्स बनते हैं जिन्हें लोग एक बार इस्तेमाल करते हैं और फिर अनदेखा कर देते हैं।
एक न्यूज़रूम की दर्जनों छोटी और विशिष्ट ज़रूरतें होती हैं। आपको हेडलाइन के विकल्पों की ज़रूरत होती है। आपको सोशल मीडिया ब्लर्ब्स (blurbs) की ज़रूरत होती है। आपको SEO टाइटल्स की ज़रूरत होती है। आपको एंटिटी टैगिंग (entity tagging) की ज़रूरत होती है। हर काम छोटा होता है लेकिन उसके अपने नियम होते हैं।
200 न्यूज़ साइट्स के साथ काम करने के बाद, मुझे इसे बनाने का सही तरीका मिल गया। एक "AI फीचर" न बनाएं। छोटे, विशिष्ट वर्कफ़्लो (workflows) की एक रजिस्ट्री बनाएं।
PHP में इसे करने का तरीका यहाँ दिया गया है:
- प्रॉम्प्ट्स (prompts) के बजाय टास्क (tasks) का उपयोग करें। एक टास्क एक निश्चित कॉन्ट्रैक्ट वाला एक नामित यूनिट है। उसे पता होता है कि उसे क्या चाहिए और वह क्या रिटर्न करता है।
- टास्क के अंदर ही आउटपुट को वैलिडेट (validate) करें। मॉडल अक्सर तब टेक्स्ट रिटर्न करते हैं जब आपको JSON चाहिए होता है। यदि टास्क अपने आउटपुट को खुद वैलिडेट करता है, तो आप अपने एडिटर को खराब किए बिना दोबारा कोशिश कर सकते हैं या शालीनता से फेल हो सकते हैं।
- टियर-आधारित राउटर (tier-based router) का उपयोग करें। सरल टास्क सस्ते मॉडल्स पर चलाएं। कानूनी या जोखिम वाले टास्क प्रीमियम मॉडल्स पर चलाएं।
- टास्क और इनपुट के आधार पर कैश (cache) करें। यदि कोई एडिटर एक ही आर्टिकल पर दो बार बटन क्लिक करता है, तो आपको दूसरी AI कॉल के लिए भुगतान नहीं करना चाहिए। कैशिंग (caching) आपका सबसे अच्छा लागत नियंत्रण (cost control) है।
- नियमों को कोड में रखें और पसंद (taste) को प्रॉम्प्ट्स में। मॉडल से यह पूछने के लिए न कहें कि क्या हेडलाइन 70 कैरेक्टर से कम है। इसके लिए PHP का उपयोग करें। मॉडल का उपयोग यह तय करने के लिए करें कि हेडलाइन अच्छी है या नहीं। कोड नियमों को संभालता है। मॉडल निर्णय (judgment) लेते हैं।
चीज़ों को व्यवस्थित रखने के लिए अपने टास्क को ग्रुप करें:
• Headlines: SEO टाइटल्स, सोशल ब्लर्ब्स, पुश नोटिफिकेशन। • Structure: सारांश (summaries), मुख्य बिंदु, 'और पढ़ें' (read more) सुझाव। • Classification: कैटेगरी सुझाव, टैग एक्सट्रैक्शन। • Media: ऑल्ट टेक्स्ट (alt text), कैप्शन, क्रॉप हिंट्स। • Quality: टोन चेक, रिस्क फ्लैग्स, अपशब्द फिल्टर (profanity filters)।
लक्ष्य ऑपरेशनल विश्वसनीयता (operational reliability) है। यदि व्यस्त न्यूज़ डे के दौरान कोई AI प्रोवाइडर डाउन हो जाता है, तो आपको अपनी कॉन्फ़िग फ़ाइल बदलनी चाहिए, न कि अपना कोड फिर से लिखना चाहिए।
सफलता के लिए दो अंतिम नियम:
- सुझाव केवल ड्राफ्ट हैं। AI को कभी भी सीधे पब्लिश किए गए फ़ील्ड में लिखने न दें। एक इंसान को हमेशा आउटपुट की समीक्षा करनी चाहिए और उसे स्वीकार करना चाहिए।
- बैकग्राउंड में काम करें। यदि किसी टास्क में एक सेकंड से अधिक समय लगता है, तो इसे एक एसिंक (async) जॉब के रूप में चलाएं। अपने एडिटर्स को लोडिंग स्क्रीन के लिए इंतज़ार न कराएं।
पहले आर्किटेक्चर बनाएं। मॉडल माध्यमिक (secondary) है।
