ਮੈਂ AI ਨਾਲ ਆਪਣੇ ਥੰਬਨੇਲ ਵਰਕਫਲੋ ਨੂੰ ਆਟੋਮੇਟ ਕੀਤਾ। ਇੱਥੇ ਦੇਖੋ ਕੀ ਹੋਇਆ।
ਮੈਂ ਇੱਕ ਬੈਕਐਂਡ ਡਿਵੈਲਪਰ ਹਾਂ। ਮੈਂ ਇੱਕ ਟੈਕਨੀਕਲ YouTube ਚੈਨਲ ਵੀ ਚਲਾਉਂਦਾ ਹਾਂ। ਪਿਛਲੇ ਹਫ਼ਤੇ, ਮੈਂ ਇੱਕ ਥੰਬਨੇਲ 'ਤੇ ਚਾਰ ਘੰਟੇ ਲਗਾਏ। ਇਸਦਾ ਕਲਿੱਕ-ਥਰੂ ਰੇਟ (click-through rate) ਸਿਰਫ਼ 2.4% ਰਿਹਾ।
ਮੈਂ ਇੱਕ ਸਿਧਾਂਤ ਦੀ ਜਾਂਚ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ। ਕੀ AI ਮੇਰੀ ਮੈਨੂਅਲ ਡਿਜ਼ਾਈਨ ਪ੍ਰਕਿਰਿਆ ਦੀ ਜਗ੍ਹਾ ਲੈ ਸਕਦਾ ਹੈ? ਕੀ ਇੱਕ text-to-thumbnail ਵਰਕਫਲੋ ਅਸਲ ਕੰਟੈਂਟ ਪਾਈਪਲਾਈਨ ਲਈ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ?
ਮੈਂ ਇਸ ਬਾਰੇ ਗਲਤ ਸੀ ਕਿ ਇਹ ਕਿੰਨਾ ਆਸਾਨ ਹੋਵੇਗਾ।
ਸਭ ਤੋਂ ਵੱਡੀ ਸਮੱਸਿਆ ਟਾਈਪੋਗ੍ਰਾਫੀ (typography) ਦੀ ਹੈ। ਥੰਬਨੇਲ ਡਿਜ਼ਾਈਨ ਵਿੱਚ, ਟੈਕਸਟ ਅੱਧੇ ਸੈਕਿੰਡ ਤੋਂ ਵੀ ਘੱਟ ਸਮੇਂ ਵਿੱਚ ਪੜ੍ਹਨਯੋਗ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਜੇਕਰ ਕੋਈ ਦੇਖਣ ਵਾਲਾ ਛੋਟੀ ਫ਼ੋਨ ਸਕ੍ਰੀਨ 'ਤੇ ਤੁਹਾਡਾ ਟਾਈਟਲ ਨਹੀਂ ਪੜ੍ਹ ਸਕਦਾ, ਤਾਂ ਉਹ ਤਸਵੀਰ ਫੇਲ੍ਹ ਹੋ ਜਾਂਦੀ ਹੈ।
ਮੈਂ ਕਈ ਪ੍ਰੋਂਪਟ (prompts) ਅਜ਼ਮਾਏ। ਜ਼ਿਆਦਾਤਰ ਨਤੀਜੇ ਬਹੁਤ ਮਾੜੇ ਸਨ।
- AI ਨੇ "FIX IT" ਨੂੰ ਇੱਕ ਪਿਘਲੇ ਹੋਏ, ਅਣਪੜ੍ਹਯੋਗ ਫੌਂਟ ਵਿੱਚ ਦਿਖਾਇਆ।
- ਇਸਨੇ ਸ਼ਬਦਾਂ ਦੀ ਗਲਤ ਸਪੈਲਿੰਗ "FIXX IT" ਲਿਖ ਦਿੱਤੀ।
- ਇਸਨੇ ਟੈਕਸਟ ਉੱਥੇ ਰੱਖ ਦਿੱਤਾ ਜਿੱਥੇ YouTube ਦਾ ਟਾਈਮਸਟੈਂਪ (timestamp) ਉਸਨੂੰ ਢੱਕ ਲਵੇਗਾ।
ਇੱਕ ਡਿਵੈਲਪਰ ਵਜੋਂ, ਮੈਂ ਉਮੀਦ ਕਰਦਾ ਹਾਂ ਕਿ ਟੂਲ ਸਪਸ਼ਟ ਐਰਰ ਮੈਸੇਜ (error messages) ਦੇ ਨਾਲ ਫੇਲ੍ਹ ਹੋਣ। AI ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਫੇਲ੍ਹ ਹੁੰਦਾ ਹੈ। ਇਹ ਚੁੱਪਚਾਪ ਅਤੇ ਬੇਤਰਤੀਬੇ ਤਰੀਕੇ ਨਾਲ ਫੇਲ੍ਹ ਹੁੰਦਾ ਹੈ। ਕੋਈ ਐਰਰ ਲੌਗ (error log) ਨਹੀਂ ਹੁੰਦਾ। ਤੁਹਾਨੂੰ ਹਰ ਵਾਰ ਬੱਸ ਇੱਕ ਵੱਖਰਾ ਗਲਤ ਜਵਾਬ ਮਿਲਦਾ ਹੈ।
ਸਮੱਸਿਆ ਆਰਕੀਟੈਕਚਰਲ (architectural) ਹੈ। ਇਮੇਜ ਮਾਡਲ ਲੇਆਉਟ ਇੰਜਣ (layout engines) ਨਹੀਂ ਹਨ। ਉਹ ਬਾਊਂਡਿੰਗ ਬਾਕਸ (bounding boxes) ਜਾਂ ਟੈਕਸਟ ਦੀ ਪੜ੍ਹਨਯੋਗਤਾ ਨੂੰ ਨਹੀਂ ਸਮਝਦੇ। ਉਹ ਅਜ