AI ഫീച്ചറുകൾക്ക് മികച്ച പ്രോംപ്റ്റുകൾ മാത്രം പോരാ, ഉൽപ്പന്നത്തിന്റെ പരിധികളും (Product Edges) ആവശ്യമാണ്
മിക്ക AI ഫീച്ചറുകളും പരാജയപ്പെടുന്നു.
മോഡൽ മോശമായതുകൊണ്ടല്ല അവ പരാജയപ്പെടുന്നത്. മറിച്ച്, മോഡലിന് ചുറ്റുമുള്ള കാര്യങ്ങളെ ഒരു ഡെമോ പോലെ മാത്രം കാണുന്നതുകൊണ്ടാണ് ഡെവലപ്പർമാർ പരാജയപ്പെടുന്നത്.
ഞാൻ അടുത്തിടെ ഒരു iOS വർക്ക്ഔട്ട് ആപ്പിൽ ജോലി ചെയ്തു. വ്യായാമ പ്ലാനുകൾക്കായി ഇത് Claude ഉപയോഗിക്കുന്നു. മോഡലിന്റെ ഭാഗം എളുപ്പമാണ്. നിങ്ങൾ കോൺടെക്സ്റ്റ് (context) നൽകുന്നു, പകരം ഒരു പ്ലാൻ ലഭിക്കുന്നു.
കഠിനമായ ജോലി എന്നത് അതിനെ ഒരു യഥാർത്ഥ ഉൽപ്പന്നമാക്കി മാറ്റുന്നതാണ്. നിങ്ങൾ ഇവ കൈകാര്യം ചെയ്യണം:
• പ്രതിമാസ AI ക്രെഡിറ്റ് ബാലൻസുകൾ • ഓഫ്ലൈൻ മോഡുകൾ • Auth ടോക്കൺ സ്റ്റോറേജ് • ജനറേഷൻ സമയത്തെ ലോഡിംഗ് സ്റ്റേറ്റുകൾ • വ്യായാമങ്ങൾ ചേർക്കുന്നതിനും മാറ്റുന്നതിനും (swapping) വ്യത്യസ്തമായ നിയമങ്ങൾ • വിരസമായ എഡ്ജ് കേസുകൾക്കായുള്ള (edge cases) ടെസ്റ്റുകൾ
ഇവിടെയാണ് ഗുണമേന്മ നിലനിൽക്കുന്നത്.
ഒരു ബട്ടൺ വെറുതെ ഒരു എൻഡ്പോയിന്റ് (endpoint) വിളിച്ചാൽ മാത്രം പോരാ. ഒരു നിർദ്ദേശം അനുവദനീയമാണോ എന്ന് അത് അറിയണം. ഉപയോക്താവ് ഓൺലൈൻ ആണോ എന്ന് പരിശോധിക്കണം. അവർക്ക് ക്രെഡിറ്റുകൾ ബാക്കിയുണ്ടോ എന്ന് പരിശോധിക്കണം.
മോഡലിന് ഈ കാര്യങ്ങളിൽ താൽപ്പര്യമില്ല. എന്നാൽ ഉപയോക്താവിന് ഇവ പ്രധാനമാണ്.
AI മറുപടി നൽകുമ്പോൾ, പുതുക്കിയ ക്രെഡിറ്റ് എണ്ണവും അതിൽ ഉൾപ്പെടുത്തണം. UI ഉടൻ തന്നെ അപ്ഡേറ്റ് ചെയ്യണം. ഇത് ഉപയോക്താവ് പഴയ വിവരങ്ങൾ (stale data) കാണുന്നത് ഒഴിവാക്കും. ഒരു ക്രെഡിറ്റ് ചിലവായെന്ന് ബാക്കെൻഡ് (backend) പറഞ്ഞാൽ, അത് ഉടൻ തന്നെ UI-ൽ കാണിക്കണം.
ഒരു വ്യൂ മോഡലിനായി (view model) ഞാൻ 13 ടെസ്റ്റുകൾ എഴുതി. ഞാൻ ക്രെഡിറ്റ് പരിധികളും ഓഫ്ലൈൻ പിശകുകളും (offline errors) പരിശോധിച്ചു. ഇത് വെറുതെയല്ല. യഥാർത്ഥ ഉപയോക്താക്കളുടെ മുന്നിൽ ഇത്തരം കാര്യങ്ങൾ തകരാറിലാകാൻ സാധ്യതയുള്ളതുകൊണ്ടാണ്.
കണക്റ്റിവിറ്റി തകരാറുകൾക്ക് വ്യക്തമായ സന്ദേശങ്ങൾ ഉണ്ടായിരിക്കണം. "unexpected server response" എന്ന് പറയരുത്. പകരം "നിങ്ങൾ ഓഫ്ലൈൻ ആണ്. AI ഫീച്ചറുകൾ ഉപയോഗിക്കാൻ വീണ്ടും കണക്ട് ചെയ്യുക" എന്ന് പറയുക.
AI ഫീച്ചറുകൾ പുറത്തിറക്കുക എന്നത് നടുവിൽ ഒരു പ്രോബബിലിസ്റ്റിക് ഡിപെൻഡൻസി (probabilistic dependency) ഉള്ള സാധാരണ സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ് ആണ്.
മോഡലിന് ചുറ്റുമുള്ള കരാറുകളിൽ (contract) ശ്രദ്ധ കേന്ദ്രീകരിക്കുക:
• ഉപയോക്താവിന് ഇപ്പോൾ തന്നെ ഇത് ഉപയോഗിക്കാൻ കഴിയുമോ? • നെറ്റ്വർക്ക് തകരാറിലായാൽ എന്ത് സംഭവിക്കും? • ഉപയോഗം കൃത്യമായി ട്രാക്ക് ചെയ്യുന്നുണ്ടോ? • UI സെർവർ സ്റ്റേറ്റ് പ്രതിഫലിപ്പിക്കുന്നുണ്ടോ? • മോഡൽ ഇല്ലാതെ തന്നെ എഡ്ജ് കേസുകൾ പരിശോധിക്കാൻ കഴിയുമോ?
ഇവ പരിഹരിച്ചുകഴിഞ്ഞാൽ, ആ ഫീച്ചർ ഒരു ബട്ടണിലെ പ്രോംപ്റ്റ് എന്നതിലുപരി നിങ്ങളുടെ ആപ്പിന്റെ ഒരു ഭാഗമായി അനുഭവപ്പെടും.
മോഡൽ മറുപടി നൽകുന്നുണ്ടോ എന്ന് ചോദിക്കരുത്. പകരം, ആ ഫീച്ചർ യഥാർത്ഥ ജീവിത സാഹചര്യങ്ങളെ അതിജീവിക്കുമോ എന്ന് ചോദിക്കുക.
Source: https://dev.to/toddssullivan/ai-features-need-product-edges-not-just-better-prompts-18k
Optional learning community: https://t.me/GyaanSetuAi
