5 ਮੈਂ ਇਸ ਹਫ਼ਤੇ ਕੀ ਸਿੱਖਿਆ

ਮੈਂ AI ਡਾਇਰੈਕਟਰੀ ਸਾਈਟਾਂ ਅਤੇ ਇੱਕ YouTube automation pipeline ਚਲਾਉਂਦਾ ਹਾਂ। ਇਸ ਹਫ਼ਤੇ, ਮੈਨੂੰ ਕਈ ਰੁਕਾਵਟਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ। ਮੇਰੇ ਬਦਲਾਅਾਂ ਤੋਂ ਮਿਲੇ ਪੰਜ ਸਬਕ ਇੱਥੇ ਹਨ।

  1. ਆਪਣੇ CI ਖਰਚਿਆਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰੋ

ਮੇਰੀ Bluesky ਪੋਸਟਿੰਗ ਸਕ੍ਰਿਪਟ GitHub Actions ਮਿੰਟਾਂ ਨੂੰ ਬਰਬਾਦ ਕਰ ਰਹੀ ਸੀ। ਹਰ ਪੋਸਟ ਤਿੰਨ ਸਾਈਟਾਂ 'ਤੇ ਇੱਕ ਵੱਡੀ build process ਨੂੰ ਟ੍ਰਿਗਰ ਕਰ ਰਹੀ ਸੀ। ਮੈਂ ਸਧਾਰਨ ਸਟੇਟਸ ਅਪਡੇਟਾਂ 'ਤੇ ਹਫ਼ਤੇ ਵਿੱਚ 120 ਮਿੰਟ ਖਰਚ ਰਿਹਾ ਸੀ।

ਮੈਂ ਦੋ ਬਦਲਾਅ ਕੀਤੇ:

  • ਮੈਂ ਤਿੰਨ ਰੋਜ਼ਾਨਾ ਟ੍ਰਿਗਰਾਂ ਤੋਂ ਬਦਲ ਕੇ ਇੱਕ ਸਿੰਗਲ ਰੋਜ਼ਾਨਾ ਟ੍ਰਿਗਰ ਕਰ ਦਿੱਤਾ।
  • ਮੈਂ ਇੱਕ path filter ਜੋੜਿਆ ਤਾਂ ਜੋ ਟੈਕਸਟ ਐਡਿਟ ਕਰਨ ਨਾਲ ਪੂਰੀ ਸਾਈਟ ਦਾ rebuild ਨਾ ਹੋਵੇ।

ਛੋਟੇ ਕੰਮਾਂ ਨੂੰ ਆਪਣਾ automation quota ਬਰਬਾਦ ਨਾ ਕਰਨ ਦਿਓ। ਆਪਣੇ ਪ੍ਰੋਜੈਕਟ ਦੇ ਵਧਣ ਤੋਂ ਪਹਿਲਾਂ ਇਹਨਾਂ ਆਦਤਾਂ ਨੂੰ ਸੁਧਾਰੋ।

  1. Automation ਵਿੱਚ Quality Control ਜੋੜੋ

ਮੈਨੂੰ ਆਪਣੀ queue ਵਿੱਚ 17 ਅਜਿਹੀਆਂ ਪੋਸਟਾਂ ਮਿਲੀਆਂ ਜੋ ਇੱਕ bot ਵਾਂਗ ਲੱਗ ਰਹੀਆਂ ਸਨ। ਉਹਨਾਂ ਵਿੱਚ "auto-generated" ਵਰਗੇ ਸ਼ਬਦ ਵਰਤੇ ਗਏ ਸਨ ਜੋ ਮੇਰੇ personal brand ਲਈ ਸਹੀ ਨਹੀਂ ਲੱਗ ਰਹੇ ਸਨ।

ਮੈਂ ਆਪਣੇ pipeline ਵਿੱਚ ਇੱਕ QC gate ਜੋੜਿਆ। ਇਹ ਕਦਮ ਪੋਸਟਾਂ ਦੀ ਇਹਨਾਂ ਚੀਜ਼ਾਂ ਲਈ ਜਾਂਚ ਕਰਦਾ ਹੈ:

  • ਟੁੱਟੇ ਹੋਏ ਲਿੰਕ (Broken links)।
  • ਮਿਆਦ ਖਤਮ ਹੋ ਚੁੱਕੀ ਖ਼ਬਰਾਂ (Expired news)।
  • ਰੋਬੋਟਿਕ ਜਾਂ ਸਪੈਮੀ ਟੋਨ (Robotic or spammy tones)।

ਜੇਕਰ ਕੋਈ ਪੋਸਟ ਫੇਲ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਇਹ ਮੈਨੁਅਲ ਰਿਵਿਊ ਲਈ queue ਵਿੱਚ ਹੀ ਰਹਿੰਦੀ ਹੈ। ਹੁਣ ਮੈਂ ਘੱਟ ਪੋਸਟ ਕਰਦਾ ਹਾਂ, ਪਰ ਗੁਣਵੱਤਾ (quality) ਵਧੇਰੇ ਹੈ।

  1. ਸਾਦਗੀ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ (Optimization) ਨੂੰ ਹਰਾ ਸਕਦੀ ਹੈ

ਮੈਂ AI model routing ਨੂੰ ਹਟਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ। ਮੈਂ ਸਧਾਰਨ ਕੰਮ ਸਸਤੇ ਮਾਡਲਾਂ ਨੂੰ ਅਤੇ ਔਖੇ ਕੰਮ ਮਹਿੰਗੇ ਮਾਡਲਾਂ ਨੂੰ ਭੇਜਦਾ ਸੀ।

ਰੋਟਰ ਨੂੰ ਹਟਾਉਣ ਤੋਂ ਬਾਅਦ, ਮੈਂ ਪਾਇਆ:

  • Latency ਉਹੀ ਰਹੀ।
  • ਖਰਚੇ 8% ਵਧ ਗਏ।
  • ਕੋਡ ਬਹੁਤ ਸੌਖਾ ਹੋ ਗਿਆ।

ਰੋਟਿੰਗ ਗਲਤੀਆਂ ਨੂੰ ਡੀਬੱਗ (debugging) ਕਰਨ ਤੋਂ ਬਚਣ ਲਈ 8% ਖਰਚੇ ਦਾ ਵਾਧਾ ਜਾਇਜ਼ ਹੈ। ਛੋਟੇ ਪੱਧਰ 'ਤੇ, ਜਟਿਲਤਾ (complexity) API ਦੀ ਬਚਤ ਨਾਲੋਂ ਵੱਧ ਖਰਚਾ ਕਰਦੀ ਹੈ।

  1. ਆਪਣੇ ਲਾਇਸੈਂਸਿੰਗ (Licensing) ਦਾ ਧਿਆਨ ਰੱਖੋ

ਮੈਂ Openverse ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ YouTube ਟੂਲ ਵਿੱਚ image slides ਜੋੜੀਆਂ। ਡਿਫੌਲਟ ਨਤੀਜਿਆਂ ਵਿੱਚ ਕਈ Creative Commons ਕਿਸਮਾਂ ਸ਼ਾਮਲ ਹਨ।

ਜੇਕਰ ਤੁਸੀਂ CC0 ਜਾਂ PDM ਲਾਇਸੈਂਸਾਂ ਲਈ ਫਿਲਟਰ ਨਹੀਂ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਅਜਿਹੀਆਂ ਤਸਵੀਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ ਜਿਨ੍ਹਾਂ ਲਈ ਸਕ੍ਰੀਨ 'ਤੇ ਕ੍ਰੈਡਿਟ ਦੇਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਮੋਨਿਟਾਈਜ਼ਡ ਚੈਨਲ ਲਈ, ਇਹ ਇੱਕ ਕਾਨੂੰਨੀ ਜੋਖਮ ਹੈ। ਅਣਜਾਣੇ ਵਿੱਚ ਕਾਪੀਰਾਈਟ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਤੋਂ ਬਚਣ ਲਈ ਹਮੇਸ਼ਾ ਆਪਣੇ API ਰਿਕੁਐਸਟਾਂ ਨੂੰ upstream ਫਿਲਟਰ ਕਰੋ।

  1. ਮਾਨੀਟਰਿੰਗ ਟੂਲ ਵਰਤਣ ਦੀ ਸੌਖ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ

ਮੈਂ Netdata, SigNoz, ਅਤੇ OpenObserve ਦਾ ਟੈਸਟ ਕੀਤਾ।

  • Netdata ਸੌਖਾ ਹੈ ਅਤੇ ਤੁਰੰਤ ਕੰਮ ਕਰਦਾ ਹੈ।
  • SigNoz ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਕੋਡ ਨੂੰ OpenTelemetry ਨਾਲ instrument ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • OpenObserve ਲੌਗਸ (logs) ਲਈ ਵਧੀਆ ਹੈ ਪਰ ਇਸਨੂੰ ਸਿੱਖਣਾ ਥੋੜਾ ਔਖਾ ਹੈ।

ਮੇਰੇ ਮੌਜੂਦਾ ਸੈੱਟਅੱਪ ਲਈ, ਇਹ ਟੂਲ ਬਹੁਤ ਜ਼ਿਆਦਾ (overkill) ਲੱਗੇ। ਇਸ ਦੀ ਬਜਾਏ ਮੈਂ ਇੱਕ ਸਧਾਰਨ error alerting integration ਚੁਣਿਆ। ਉਹ ਟੂਲ ਚੁਣੋ ਜੋ ਤੁਹਾਡੇ ਮੌਜੂਦਾ ਇਨਫਰਾਸਟ੍ਰਕਚਰ (infrastructure) ਦੇ ਅਨੁਕੂਲ ਹੋਵੇ, ਨਾ ਕਿ ਸਭ ਤੋਂ ਜਟਿਲ।

ਸਰੋਤ: https://dev.to/morinaga/5-things-i-noticed-this-week-ci-cost-bluesky-qc-and-cc0-licensing-49ig