एलर्जेन जोखिम मूल्यांकन का स्वचालन

प्लांट-आधारित खाद्य निर्माता लगातार बदलते अवयवों (ingredients) और आपूर्तिकर्ताओं के बदलावों को प्रबंधित करते हैं। एक भी छिपा हुआ एलर्जेन या क्रॉस-कॉन्टैक्ट (cross-contact) की घटना रिकॉल और भरोसे की कमी का कारण बन सकती है। AI इस प्रतिक्रियात्मक संघर्ष को एक सक्रिय सुरक्षा योजना में बदल देता है।

यह मॉडल जोखिम को ट्रैक करने के लिए Bayesian updating का उपयोग करता है। यह प्रत्येक एलर्जेन को एक परिकल्पना (hypothesis) के रूप में मानता है। आप सामग्री की सूची, आपूर्तिकर्ता विनिर्देशों (supplier specs) और उत्पादन लॉग जैसे नए डेटा के साथ इस परिकल्पना को अपडेट करते हैं। प्रत्येक साक्ष्य, जैसे कि एक साझा उत्पादन लाइन, प्रायिकता स्कोर (probability score) को बदल देता है। यह आपको जानबूझकर डाले गए अवयवों और आकस्मिक संपर्क (accidental contact) के बीच अंतर करने में मदद करता है।

ओपन-सोर्स लाइब्रेरी spaCy आपको कच्चे डेटा (raw data) को प्रोसेस करने में मदद करती है। यह सामग्री की स्ट्रिंग्स से एलर्जेन शब्दों को निकालती है और 'नेचुरल फ्लेवर्स' जैसे छिपे हुए उल्लेखों को चिह्नित करती है। यह टूल आपके रिस्क मॉडल को डेटा देने के लिए एक स्वच्छ सूची तैयार करता है।

कल्पना कीजिए कि आप एक नया ओट प्रोटीन पाउडर जोड़ते हैं। spaCy आपूर्तिकर्ता विनिर्देश (supplier spec) को पढ़ती है और सोया के अंशों (traces of soy) के बारे में एक नोट पाती है। मॉडल इसे आपके साझा उपकरणों के इतिहास के साथ जोड़ता है। यह सोया जोखिम स्कोर को 5% से बढ़ाकर 22% कर देता है, जिससे एक विशिष्ट सफाई जांच (cleaning check) की आवश्यकता पड़ती है।

इस सिस्टम को लागू करने के लिए इन चरणों का पालन करें:

  • डेटा को एक्सपोर्ट और नॉर्मलाइज़ करें। अपने उत्पादन शेड्यूल और आपूर्तिकर्ता विनिर्देश शीट को एक स्प्रेडशीट में लाएं। कच्चे लेबल को एक संरचित तालिका (structured table) में बदलने के लिए spaCy का उपयोग करें।

  • अपना मॉडल टियर चुनें। टियर 1 के लिए, अपनी स्प्रेडशीट में सरल नियमों का उपयोग करें। टियर 2 के लिए, अपने बैच लॉग के साथ क्लासिफायर फिट करने के लिए Python का उपयोग करें। टियर 3 के लिए, बड़े डेटासेट को संभालने के लिए क्लाउड सेवाओं का उपयोग करें।

  • अपने एलर्जेन मैट्रिक्स के साथ एकीकृत करें। प्रायिकता आउटपुट (probability outputs) को वापस अपने मैट्रिक्स में डालें। यह सुनिश्चित करता है कि किसी भी सामग्री परिवर्तन से आपके जोखिम स्कोर स्वचालित रूप से अपडेट हो जाएं।

Bayesian updating अव्यवस्थित डेटा को स्पष्ट जोखिम प्रायिकता (risk probabilities) में बदल देता है।

spaCy जैसे टूल बिना किसी बड़ी डेटा साइंस टीम के कच्चे लेबल को संरचित डेटा में बदल देते हैं।

यह तीन-चरणीय पाइपलाइन एक कम लागत वाला रोडमैप प्रदान करती है। जैसे-जैसे आप विस्तार करेंगे, आप मैन्युअल समीक्षा समय को 50% तक कम कर सकते हैं और पहचान सटीकता (detection accuracy) को 70-90% तक सुधार सकते हैं।

Source: https://dev.to/ken_deng_ai/automating-allergen-risk-assessment-ai-driven-detection-of-cross-contact-and-hidden-allergens-5b6f

Optional learning community: https://t.me/GyaanSetuAi