ਕੋਈ ਵੀ ਤੁਹਾਡੇ ਰੋਬੋਟ ਦੇ PRs ਦੀ ਸਮੀਖਿਆ ਨਹੀਂ ਕਰ ਰਿਹਾ

AI ਏਜੰਟ ਆਪਣੇ ਕੰਮ ਬਾਰੇ ਝੂਠ ਬੋਲਦੇ ਹਨ।

ਉਦਯੋਗ ਦੇ ਮੋਹਰੀ ਇਸ ਗੱਲ ਨੂੰ ਮੰਨਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਨ। ਇੱਕ ਡਿਵੈਲਪਰ ਨੇ ਇੱਕ AI ਏਜੰਟ ਨਾਲ ਇੱਕ ਐਪ ਬਣਾਈ। ਉਸਨੇ ਏਜੰਟ ਨੂੰ ਬਦਲਾਅ ਕਰਨਾ ਬੰਦ ਕਰਨ ਲਈ ਕਿਹਾ। ਏਜੰਟ ਨੇ ਉਸਦੀ ਗੱਲ ਅਣਗੌਲੀ ਕਰ ਦਿੱਤੀ। ਉਸਨੇ ਉਸਦਾ production database ਡਿਲੀਟ ਕਰ ਦਿੱਤਾ ਅਤੇ ਗਲਤੀ ਨੂੰ ਛੁਪਾਉਣ ਲਈ ਚਾਰ ਹਜ਼ਾਰ ਫਰਜ਼ੀ ਰਿਕਾਰਡ ਬਣਾ ਦਿੱਤੇ। ਫਿਰ, ਉਸਨੇ ਉਸਨੂੰ ਇੱਕ ਕਹਾਣੀ ਸੁਣਾਈ ਕਿ ਅਜਿਹਾ ਕਿਉਂ ਹੋਇਆ।

ਇਹ ਕੋਈ ਇਕੱਲੀ ਘਟਨਾ ਨਹੀਂ ਹੈ। ਅਧਿਐਨ ਦਿਖਾਉਂਦੇ ਹਨ ਕਿ AI ਕੋਡ ਵਿੱਚ ਮਨੁੱਖੀ ਕੋਡ ਨਾਲੋਂ ਗਲਤੀਆਂ ਦੀ ਦਰ ਵਧੇਰੇ ਹੁੰਦੀ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਟੈਸਟਿੰਗ ਪਾਸ ਕਰਨ ਤੋਂ ਬਾਅਦ ਵੀ ਉਹਨਾਂ ਨੂੰ AI ਕੋਡ ਨੂੰ ਡੀਬੱਗ (debug) ਕਰਨਾ ਪੈਂਦਾ ਹੈ।

ਇੱਕ ਕੰਪਨੀ ਅਤੇ ਇੱਕ homelab ਵਿਚਕਾਰ ਵੱਡਾ ਅੰਤਰ ਸੁਰੱਖਿਆ ਜਾਲ (safety net) ਦਾ ਹੈ।

ਕੰਪਨੀਆਂ staging environments ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ। ਉਹ pull requests ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ। ਉਹ ਮਨੁੱਖੀ ਸਮੀਖਿਆਕਾਰਾਂ (human reviewers) ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਸੁਰੱਖਿਆ ਪ੍ਰਬੰਧ (guardrails) ਝੂਠ ਨੂੰ ਫੜ ਲੈਂਦੇ ਹਨ।

ਇੱਕ homelab ਵਿੱਚ, ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ ਸੁਰੱਖਿਆ ਜਾਲ ਨਹੀਂ ਹੁੰਦਾ।

ਤੁਸੀਂ ਇੱਕ ਏਜੰਟ ਨੂੰ ਆਪਣੇ ਸੈੱਟਅੱਪ ਤੱਕ ਪਹੁੰਚ ਦਿੰਦੇ ਹੋ। ਉਹ ਤੁਹਾਡੀਆਂ config ਫਾਈਲਾਂ ਲਿਖਦਾ ਹੈ। ਉਹ ਤੁਹਾਡੇ environment variables ਨੂੰ ਐਡਿਟ ਕਰਦਾ ਹੈ। ਉਹ ਤੁਹਾਡੇ proxy ਨੂੰ ਮੈਨੇਜ ਕਰਦਾ ਹੈ। ਤੁਹਾਡੇ ਗੈਰੇਜ ਵਿੱਚ ਕੋਈ staging tier ਨਹੀਂ ਹੁੰਦਾ। pull request ਪੜ੍ਹਨ ਲਈ ਕੋਈ ਮਨੁੱਖ ਨਹੀਂ ਹੁੰਦਾ। ਉੱਥੇ ਸਿਰਫ਼ ਤੁਸੀਂ ਅਤੇ ਇੱਕ ਹਰਾ (green) ਡੈਸ਼ਬੋਰਡ ਹੁੰਦਾ ਹੈ।

ਡੈਸ਼ਬੋਰਡ ਇੱਕ ਜਾਲ ਹੈ।

ਆਮ ਸਲਾਹ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਕਿ uptime monitors ਦੀ ਵਰਤੋਂ ਕਰੋ। ਜੇਕਰ ਕੋਈ ਸਰਵਿਸ ਜਵਾਬ ਦਿੰਦੀ ਹੈ, ਤਾਂ ਮੋਨੀਟਰ ਹਰਾ ਦਿਖਾਉਂਦਾ ਹੈ। ਪਰ ਜਵਾਬ ਦੇਣਾ ਕੰਮ ਕਰਨ ਦੇ ਬਰਾਬਰ ਨਹੀਂ ਹੈ। ਇੱਕ ਸਰਵਿਸ ping ਦਾ ਜਵਾਬ ਦੇ ਸਕਦੀ ਹੈ ਜਦੋਂ ਕਿ ਅਸਲ ਐਪਲੀਕੇਸ਼ਨ ਬੰਦ ਹੋਵੇ।

ਮੈਂ ਇਹ ਇੱਕ firewall ਸੈੱਟਅੱਪ ਵਿੱਚ ਦੇਖਿਆ। ਮੈਂ ਇੱਕ Docker host ਨੂੰ ਸੁਰੱਖਿਅਤ (harden) ਕਰਨ ਲਈ ਇੱਕ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਡੈਸ਼ਬੋਰਡ ਨੇ ਕਿਹਾ ਕਿ firewall ਐਕਟਿਵ ਅਤੇ ਹਰਾ ਸੀ। ਅਸਲ ਵਿੱਚ, ਉਸ ਟੂਲ ਨੇ ਪੂਰੇ ਪ੍ਰਾਈਵੇਟ ਨੈੱਟਵਰਕ ਨੂੰ ਖੁੱਲ੍ਹਾ ਛੱਡ ਦਿੱਤਾ ਸੀ। ਇਹ ਇੱਕ ਤਾਲੇ ਵਾਂਗ ਕੰਮ ਕਰ ਰਹੀ ਇੱਕ ਜਾਲੀ ਵਾਲੇ ਦਰਵਾਜ਼ੇ (screen door) ਵਾਂਗ ਸੀ।

ਮੈਂ ਕੰਟੇਨਰਾਂ (containers) ਨੂੰ ਇਹ ਰਿਪੋਰਟ ਕਰਦੇ ਦੇਖਿਆ ਹੈ ਕਿ ਉਹ ਚੱਲ ਰਹੇ ਹਨ ਜਦੋਂ ਕਿ ਅੰਦਰਲੀ ਸਰਵਿਸ ਕ੍ਰੈਸ਼ ਹੋ ਰਹੀ ਹੁੰਦੀ ਹੈ। ਮੈਂ ਅਜਿਹੀਆਂ ਸਰਵਿਸਾਂ ਦੇਖੀਆਂ ਹਨ ਜੋ pings ਦਾ ਜਵਾਬ ਤਾਂ ਦਿੰਦੀਆਂ ਹਨ ਪਰ ਕੋਈ ਅਸਲ ਡਾਟਾ ਪ੍ਰੋਸੈਸ ਨਹੀਂ ਕਰ ਸਕਦੀਆਂ।

ਏਜੰਟ ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ ਕਿ ਉਸਨੇ ਕੀ ਕੀਤਾ। ਡੈਸ਼ਬੋਰਡ ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ ਕਿ ਉਹ ਕੀ ਸੋਚਦਾ ਹੈ। ਦੋਵੇਂ ਝੂਠ ਬੋਲ ਸਕਦੇ ਹਨ।

ਤੁਹਾਨੂੰ ਇੱਕ ਨਵੇਂ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਹੈ।

ਇਹ ਪੁੱਛਣਾ ਬੰਦ ਕਰੋ ਕਿ ਕੀ ਕੋਈ ਸਰਵਿਸ ਚੱਲ ਰਹੀ ਹੈ। ਇਹ ਪੁੱਛਣਾ ਸ਼ੁਰੂ ਕਰੋ ਕਿ ਕੀ ਇਹ ਆਪਣਾ ਕੰਮ ਕਰ ਰਹੀ ਹੈ। ਇਸਨੂੰ ਤੋੜਨ