ഈ ആഴ്ച ഞാൻ പഠിച്ച 5 കാര്യങ്ങൾ
ഞാൻ AI ഡയറക്ടറി സൈറ്റുകളും ഒരു YouTube ഓട്ടോമേഷൻ പൈപ്പ്ലൈനും പ്രവർത്തിപ്പിക്കുന്നു. ഈ ആഴ്ച, ചില തടസ്സങ്ങൾ നേരിടേണ്ടി വന്നു. എന്റെ മാറ്റങ്ങളിൽ നിന്നുള്ള അഞ്ച് പാഠങ്ങൾ താഴെ പറയുന്നവയാണ്.
1. നിങ്ങളുടെ CI ചിലവുകൾ നിയന്ത്രിക്കുക
എന്റെ Bluesky പോസ്റ്റിംഗ് സ്ക്രിപ്റ്റ് GitHub Actions മിനിറ്റുകൾ പാഴാക്കിക്കൊണ്ടിരിക്കുകയായിരുന്നു. ഓരോ പോസ്റ്റും മൂന്ന് സൈറ്റുകളിലുടനീളം വലിയൊരു ബിൽഡ് പ്രക്രിയയ്ക്ക് കാരണമാകുന്നുണ്ടായിരുന്നു. ലളിതമായ സ്റ്റാറ്റസ് അപ്ഡേറ്റുകൾക്കായി ഞാൻ ആഴ്ചയിൽ 120 മിനിറ്റുകൾ ചിലവഴിക്കുന്നുണ്ടായിരുന്നു.
ഞാൻ രണ്ട് മാറ്റങ്ങൾ വരുത്തി:
- ദിവസേനയുള്ള മൂന്ന് ട്രിഗറുകളിൽ നിന്ന് ഒരു സിംഗിൾ ഡെയ്ലി ട്രിഗറിലേക്ക് ഞാൻ മാറി.
- ടെക്സ്റ്റ് എഡിറ്റുകൾ കാരണം സൈറ്റ് മുഴുവനായി റീബിൽഡ് ആകാതിരിക്കാൻ ഞാൻ ഒരു പാത്ത് ഫിൽട്ടർ (path filter) ചേർത്തു.
ചെറിയ ജോലികൾക്കായി നിങ്ങളുടെ ഓട്ടോമേഷൻ ക്വാട്ട പാഴാക്കരുത്. നിങ്ങളുടെ പ്രോജക്റ്റ് വലുതാകുന്നതിന് മുമ്പ് തന്നെ ഈ ശീലങ്ങൾ തിരുത്തുക.
2. ഓട്ടോമേഷനിൽ ക്വാളിറ്റി കൺട്രോൾ ഉൾപ്പെടുത്തുക
എന്റെ ക്യൂവിൽ (queue) ഒരു ബോട്ട് എഴുതിയതുപോലെ തോന്നിക്കുന്ന 17 പോസ്റ്റുകൾ ഞാൻ കണ്ടെത്തി. എന്റെ പേഴ്സണൽ ബ്രാൻഡിന് അനുയോജ്യമല്ലാത്ത "auto-generated" പോലുള്ള പ്രയോഗങ്ങൾ അവ ഉപയോഗിച്ചിരുന്നു.
എന്റെ പൈപ്പ്ലൈനിൽ ഞാൻ ഒരു QC ഗേറ്റ് ചേർത്തു. ഈ ഘട്ടം പോസ്റ്റുകളിൽ താഴെ പറയുന്നവ പരിശോധിക്കുന്നു:
- തകരാറിലായ ലിങ്കുകൾ (Broken links).
- കാലഹരണപ്പെട്ട വാർത്തകൾ.
- റോബോട്ടിക് അല്ലെങ്കിൽ സ്പാം പോലെയുള്ള ശൈലികൾ.
ഒരു പോസ്റ്റ് പരാജയപ്പെട്ടാൽ, അത് മാനുവൽ റിവ്യൂവിനായി ക്യൂവിൽ തന്നെ നിൽക്കും. ഇപ്പോൾ ഞാൻ കുറഞ്ഞ തവണ മാത്രമേ പോസ്റ്റ് ചെയ്യുന്നുള്ളൂ, എന്നാൽ ഗുണനിലവാരം കൂടുതലാണ്.
3. ഒപ്റ്റിമൈസേഷനേക്കാൾ ലാഭകരം ലളിതമാക്കൽ ആകാം
ഞാൻ AI മോഡൽ റൂട്ടിംഗ് (AI model routing) ഒഴിവാക്കാൻ ശ്രമിച്ചു. ലളിതമായ ജോലികൾ കുറഞ്ഞ ചിലവുള്ള മോഡലുകളിലേക്കും കഠിനമായ ജോലികൾ വിലകൂടിയ മോഡലുകളിലേക്കും അയക്കുകയായിരുന്നു ഞാൻ ചെയ്തിരുന്നത്.
റൂട്ടർ ഒഴിവാക്കിയ ശേഷം ഞാൻ കണ്ടെത്തിയത്:
- ലേറ്റൻസി (Latency) മാറ്റമില്ലാതെ തുടർന്നു.
- ചിലവ് 8% വർദ്ധിച്ചു.
- കോഡ് വളരെ ലളിതമായി.
റൂട്ടിംഗ് പിശകുകൾ ഡിബഗ് ചെയ്യുന്നത് ഒഴിവാക്കാൻ ഈ 8% ചിലവ് വർദ്ധനവ് അർഹതപ്പെട്ടതാണ്. ചെറിയ തോതിലുള്ള പ്രവർത്തനങ്ങളിൽ, API ലാഭത്തേക്കാൾ കൂടുതൽ ചിലവ് വരുത്തുന്നത് സങ്കീർണ്ണതയാണ്.
4. ലൈസൻസിംഗിൽ ശ്രദ്ധിക്കുക
ഞാൻ Openverse ഉപയോഗിച്ച് എന്റെ YouTube ടൂളിൽ ഇമേജ് സ്ലൈഡുകൾ ചേർത്തു. ഡിഫോൾട്ട് റിസൾട്ടുകളിൽ പലതരം Creative Commons ലൈസൻസുകൾ ഉൾപ്പെടുന്നു.
നിങ്ങൾ CC0 അല്ലെങ്കിൽ PDM ലൈസൻസുകൾക്കായി ഫിൽട്ടർ ചെയ്തില്ലെങ്കിൽ, സ്ക്രീനിൽ ക്രെഡിറ്റ് നൽകേണ്ടി വരുന്ന ചിത്രങ്ങൾ നിങ്ങൾ ഉപയോഗിച്ചേക്കാം. വരുമാനം ലഭിക്കുന്ന (monetized) ഒരു ചാനലിനെ സംബന്ധിച്ചിടത്തോളം ഇത് ഒരു നിയമപരമായ റിസ്കാണ്. അപ്രതീക്ഷിതമായ പകർപ്പവകാശ പ്രശ്നങ്ങൾ ഒഴിവാക്കാൻ എപ്പോഴും നിങ്ങളുടെ API റിക്വസ്റ്റുകൾ അപ്പസ്ട്രീമിൽ (upstream) തന്നെ ഫിൽട്ടർ ചെയ്യുക.
5. മോണിറ്ററിംഗ് ടൂളുകൾ ഉപയോഗിക്കാやすതയെ ആശ്രയിച്ചിരിക്കുന്നു
ഞാൻ Netdata, SigNoz, OpenObserve എന്നിവ പരീക്ഷിച്ചു.
- Netdata എളുപ്പമാണ്, ഉടൻ തന്നെ പ്രവർത്തിച്ചു തുടങ്ങുന്നു.
- SigNoz ഉപയോഗിക്കാൻ നിങ്ങളുടെ കോഡിൽ OpenTelemetry ഉപയോഗിച്ച് ഇൻസ്ട്രുമെന്റേഷൻ (instrumentation) ചെയ്യേണ്ടതുണ്ട്.
- OpenObserve ലോഗുകൾക്ക് മികച്ചതാണ്, എന്നാൽ പഠിച്ചെടുക്കാൻ പ്രയാസമാണ്.
എന്റെ നിലവിലെ സെറ്റപ്പിൽ, ഈ ടൂളുകൾ അനാവശ്യമായി തോന്നി. പകരം ഞാൻ ലളിതമായ ഒരു എറർ അലേർട്ടിംഗ് ഇന്റഗ്രേഷൻ (error alerting integration) തിരഞ്ഞെടുത്തു. ഏറ്റവും സങ്കീർണ്ണമായ ടൂളിന് പകരം നിങ്ങളുടെ നിലവിലെ ഇൻഫ്രാസ്ട്രക്ചറിന് അനുയോജ്യമായ ടൂൾ തിരഞ്ഞെടുക്കുക.
Source: https://dev.to/morinaga/5-things-i-noticed-this-week-ci-cost-bluesky-qc-and-cc0-licensing-49ig
