ML മനോഭാവം

കൃത്യതയ്ക്ക് (accuracy) വേണ്ടി മാത്രം മോഡലുകൾ നിർമ്മിക്കുന്നത് നിർത്തുക. ഉയർന്ന സ്കോറുകൾ കൊണ്ട് മാത്രം കാര്യങ്ങൾ നടക്കില്ല. ബിസിനസ്സ് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്ന മോഡലുകളാണ് നിങ്ങൾ നിർമ്മിക്കേണ്ടത്.

ഒരു ബിസിനസ്സ് കേസിൽ നിന്ന് പ്രൊഡക്ഷനിലേക്ക് മാറാൻ ഈ റോഡ്മാപ്പ് പിന്തുടരുക.

ആദ്യം ബിസിനസ്സ് മൂല്യം നിർണ്ണയിക്കുക

കോഡ് എഴുതുന്നതിന് മുമ്പ് നിങ്ങളുടെ ലക്ഷ്യം എന്താണെന്ന് നിശ്ചയിക്കുക. ഒരു മോഡൽ കൃത്യത 5 ശതമാനം വർദ്ധിപ്പിച്ചാൽ, അത് എത്രത്തോളം ലാഭം ഉണ്ടാക്കും? ഈ മൂല്യം കണക്കാക്കാൻ നിങ്ങൾക്ക് കഴിയില്ലെങ്കിൽ, ആ മോഡൽ നിർമ്മിക്കരുത്. ഒരു റെക്കമെൻഡേഷൻ എഞ്ചിൻ വിൽപ്പനയോ (sales) അല്ലെങ്കിൽ ഉപഭോക്താക്കളുടെ ഇടപെടലോ (engagement) വർദ്ധിപ്പിക്കണം. തുടങ്ങുന്നതിന് മുമ്പ് ഒരു ബേസ്‌ലൈൻ (baseline) നിശ്ചയിക്കാൻ പഴയ ഡാറ്റ ഉപയോഗിക്കുക.

ലളിതത തിരഞ്ഞെടുക്കുക

ഒരു ലളിതമായ linear regression അല്ലെങ്കിൽ അടിസ്ഥാനപരമായ ഒരു heuristic ഉപയോഗിച്ച് തുടങ്ങുക. പുരോഗതി അളക്കുന്നതിന് നിങ്ങൾക്ക് ഒരു ബേസ്‌ലൈൻ ആവശ്യമാണ്. ലളിതമായ മോഡലുകൾ ഡിബഗ് (debug) ചെയ്യാൻ എളുപ്പമാണ് കൂടാതെ കുറഞ്ഞ കമ്പ്യൂട്ട് പവർ മാത്രമേ ആവശ്യമുള്ളൂ. ലളിതമായ മോഡലുകൾ നിങ്ങളുടെ ലക്ഷ്യങ്ങൾ നിറവേറ്റുന്നതിൽ പരാജയപ്പെട്ടാൽ മാത്രം സങ്കീർണ്ണതകൾ കൂട്ടിച്ചേർക്കുക. ലഭിക്കുന്ന പ്രകടനം (performance gain) അധികമായി വരുന്ന ചിലവിനേക്കാൾ കൂടുതലായിരിക്കണം.

വിശദീകരിക്കാൻ കഴിയുന്നതിന് (explainability) മുൻഗണന നൽകുക

ഉപഭോക്താക്കൾക്കും ഓഡിറ്റർമാർക്കും നിങ്ങളുടെ പ്രവചനങ്ങൾ (predictions) വിശ്വസിക്കണം. കാര്യങ്ങൾ വ്യക്തമായി നിലനിർത്താൻ decision trees ഉപയോഗിക്കുക. നിങ്ങൾ സങ്കീർണ്ണമായ മോഡലുകളാണ് ഉപയോഗിക്കുന്നതെങ്കിൽ, തീരുമാനങ്ങൾ വിശദീകരിക്കാൻ SHAP അല്ലെങ്കിൽ LIME പോലുള്ള ടൂളുകൾ ഉപയോഗിക്കുക. ഒരു മോഡൽ എന്തുകൊണ്ട് ഒരു പ്രത്യേക തീരുമാനം എടുത്തു എന്ന് വിശദീകരിക്കാൻ നിങ്ങൾക്ക് കഴിയില്ലെങ്കിൽ, അത് ഡിപ്ലോയ് (deploy) ചെയ്യരുത്.

പരാജയങ്ങൾക്കായി പരിശോധിക്കുക

ശരാശരി പിശക് (average error) മാത്രം നോക്കിയാൽ പോരാ. മാറ്റങ്ങളെ മോഡൽ എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു എന്ന് കാണാൻ ഭാവിയിലെ ഡാറ്റ ഉപയോഗിച്ച് പരിശോധിക്കുക. നിങ്ങളുടെ edge cases കണ്ടെത്തുക. ഡാറ്റ തെറ്റായ രീതിയിലാകുമ്പോഴോ (corrupt) ഉപഭോക്താക്കൾ പ്രതീക്ഷിക്കാത്ത മൂല്യങ്ങൾ നൽകുന്നအခോ എന്ത് സംഭവിക്കുമെന്ന് തിരിച്ചറിയുക.

പ്രൊഡക്ഷൻ ചിലവുകൾ നിയന്ത്രിക്കുക

നിങ്ങളുടെ മെയിന്റനൻസ് ചിലവുകളെ ബിസിനസ്സ് മൂല്യവുമായി താരതമ്യം ചെയ്യുക. മെയിന്റനൻസ് ചിലവ് സൃഷ്ടിക്കപ്പെട്ട മൂല്യത്തേക്കാൾ കൂടുതലാണെങ്കിൽ, ആ മോഡൽ പരാജയമാണ്.

ഒരു ഓപ്പറേഷണൽ സേഫ്റ്റിനെറ്റ് നിർമ്മിക്കുക

  • പ്രവചിക്കാവുന്ന രീതിയിലുള്ള ഡിപ്ലോയ്‌മെന്റിനായി നിങ്ങളുടെ മോഡൽ കണ്ടെയ്‌നറൈസ് (Containerize) ചെയ്യുക.
  • സെക്കൻഡുകൾക്കുള്ളിൽ പഴയ വേർഷനിലേക്ക് തിരിച്ചുപോകാൻ (rollback) കഴിയുന്ന രീതിയിൽ വേർഷനിംഗ് (versioning) ക്രമീകരിക്കുക.
  • ലേറ്റൻസിയും (latency) ഫീച്ചർ ഡ്രിഫ്റ്റും (feature drift) നിരീക്ഷിക്കുക.
  • ഡോക്യുമെന്റേഷൻ തയ്യാറാക്കുക. ഒരു ഡിപ്ലോയ്‌മെന്റ് ഗൈഡും മോണിറ്ററിംഗ് പ്ലേബുക്കും ഇതിൽ ഉൾപ്പെടുത്തുക.

ഒരു അലേർട്ട് (alert) വരുമ്പോൾ എഞ്ചിനീയർമാർ കൃത്യമായി എന്താണ് ചെയ്യേണ്ടതെന്ന് ഒരു നല്ല പ്ലേബുക്ക് പറഞ്ഞുതരുന്നു. ഇത് ഓരോ മണിക്കൂറിലും ഒരു ഡാറ്റാ സയന്റിസ്റ്റിന്റെ സഹായമില്ലാതെ തന്നെ മോഡൽ കൈകാര്യം ചെയ്യാൻ നിങ്ങളുടെ ടീമിനെ അനുവദിക്കുന്നു.

Source: https://dev.to/venu_varma/ml-mindset-hl

Optional learning community: https://t.me/GyaanSetuAi