'सत्यतेचा स्रोत' (Source of Truth) समस्या

एंटरप्राइझ AI टीम्ससमोर एक कठीण प्रश्न असतो.

"योग्य उत्तर काय आहे?"

हा प्रश्न मॉडेलकडून येत नाही. तो व्यवसायाकडून (business) येतो.

लहान स्तरावर हे सोपे वाटते. परंतु एंटरप्राइझ स्तरावर, ही एक मोठी आर्किटेक्चरल समस्या बनते. बहुतेक कंपन्यांकडे सत्याचा एकच स्रोत नसतो. त्यांच्याकडे अनेक असतात.

कंपन्या अनेक प्रणालींचा (systems) वापर करतात:

  • CRM
  • ERP
  • Ticketing systems
  • Internal databases
  • Spreadsheets
  • Documentation platforms

प्रत्येक प्रणालीमध्ये डेटा असतो. प्रत्येक प्रणाली काळानुसार बदलत असते. एक ग्राहक तीन वेगवेगळ्या ठिकाणी तीन वेगवेगळ्या स्थितीसह (statuses) असू शकतो.

AI या समस्या निर्माण करत नाही. ते फक्त त्या समोर आणते.

AI च्या आधी, मनुष्य गोंधळलेल्या (messy) डेटा हाताळत असे. कोणते रिपोर्ट जुने आहेत हे कर्मचाऱ्यांना माहित असे. कोणत्या डेटाबेसवर विश्वास ठेवायचा हे त्यांना ठाऊक असे.

AI कडे हे अंतर्ज्ञान (intuition) नसते. जेव्हा AI एकाधिक स्रोतांतून डेटा घेते, तेव्हा तिला सत्याची प्रत्येक आवृत्ती एकाच वेळी दिसते.

जर एक प्रणाली म्हणत असेल की ग्राहक "Active" आहे आणि दुसरी म्हणत असेल की तो "Suspended" आहे, तर AI अडखळते. दोन्ही प्रणाली चुकीच्या नाहीत. समस्या 'मालकी हक्काची' (ownership) आहे.

अधिक डेटा असल्यास AI सुधारते, असा विचार करणे ही एक सामान्य चूक आहे. अनेकदा, अधिक डेटा अधिक गोंधळ निर्माण करतो. अधिक इंटिग्रेशन्समुळे (integrations) अधिक डुप्लिकेट्स आणि अधिक संघर्ष निर्माण होतात.

रिट्रिव्हल सिस्टिम्स (Retrieval systems) संबंधित डेटा शोधतात. त्या अधिकृत (authoritative) डेटा शोधत नाहीत.

तुम्हाला ठरवावे लागेल:

  • ग्राहकाची स्थिती (customer status) कोणत्या प्रणालीकडे आहे?
  • किंमत (pricing) कोणत्या प्रणालीकडे आहे?
  • इन्व्हेंटरी (inventory) कोणत्या प्रणालीकडे आहे?

हे निर्णय गव्हर्नन्सचे (governance) आहेत, अल्गोरिदमचे नाहीत.

हे सुधारण्यासाठी, तुम्हाला स्रोतांची श्रेणी (source hierarchy) निश्चित करावी लागेल. सर्व प्रणाली समान नसतात. तुम्हाला त्यांना लेबल लावावे लागेल:

  • Primary source (प्राथमिक स्रोत)
  • Secondary source (दुय्यम स्रोत)
  • Fallback source (फॉलबॅक स्रोत)

यामुळे अंदाज लावण्याची गरज उरत नाही. मॉडेलने डेटा पाहण्यापूर्वीच इन्फ्रास्ट्रक्चर सत्याचा निर्णय घेते.

एंटरप्राइझ AI चे यश मॉडेल निवडीपेक्षा गव्हर्नन्सवर अधिक अवलंबून असते. जर तुम्ही मालकी हक्क (ownership) निश्चित केला नाही, तर तुम्हाला खालील गोष्टींचा सामना करावा लागेल:

  • विसंगत उत्तरे (Inconsistent answers)
  • परस्परविरोधी निकाल (Conflicting results)
  • अविश्वसनीय ऑटोमेशन (Unreliable automation)
  • वापरकर्त्यांचा कमी विश्वास (Low user trust)

जर वापरकर्त्यांनी पाहिले की AI आपले मत बदलत आहे, तर ते त्याचा वापर करणे थांबवतील.

AI कडे केवळ एक 'रिट्रिव्हल समस्या' म्हणून पाहणे थांबवा. त्याकडे 'डेटा ओनरशिप समस्या' म्हणून पाहण्यास सुरुवात करा.

सर्वात कठीण प्रश्न हा नाही की मॉडेलने काय उत्तर दिले पाहिजे. सर्वात कठीण प्रश्न हा आहे की प्रत्यक्षात सत्य काय आहे.

Source: https://dev.to/karan2598/the-source-of-truth-problem-every-enterprise-ai-team-faces-2m2k

Optional learning community: https://t.me/GyaanSetuAi