நான் எனது தம்ப்நெயில் பணிப்பாய்வை AI மூலம் தானியக்கமாக்கினேன். என்ன நடந்தது என்பதை இங்கே காணலாம்.
நான் ஒரு பேக்எண்ட் டெவலப்பர் (backend developer). நான் ஒரு தொழில்நுட்ப YouTube சேனலையும் நடத்துகிறேன். கடந்த வாரம், ஒரு தம்ப்நெயிலுக்காக நான் நான்கு மணிநேரம் செலவிட்டேன். ஆனால் அதற்கு வெறும் 2.4% கிளிக்-த்ரூ ரேட் (click-through rate) மட்டுமே கிடைத்தது.
ஒரு கோட்பாட்டைச் சோதித்துப் பார்க்க முடிவு செய்தேன். எனது கைமுறை வடிவமைப்புச் செயல்பாட்டை (manual design process) AI-ஆல் மாற்ற முடியுமா? ஒரு உண்மையான உள்ளடக்கப் பணிப்பாய்விற்கு (content pipeline) 'text-to-thumbnail' பணிப்பாய்வு பயன்படுமா?
இது எவ்வளவு எளிதாக இருக்கும் என்று நான் தவறாகக் கணித்தேன்.
இதில் மிகப்பெரிய பிரச்சனை எழுத்துரு வடிவமைப்பு (typography) ஆகும். தம்ப்நெயில் வடிவமைப்பில், எழுத்துக்கள் அரை வினாடிக்கும் குறைவான நேரத்தில் வாசிக்கக்கூடியதாக இருக்க வேண்டும். ஒரு பார்வையாளரால் சிறிய போன் திரையில் உங்கள் தலைப்பை வாசிக்க முடியாவிட்டால், அந்தப் படம் தோல்வியடைந்துவிடும்.
நான் பல ப்ராம்ப்ட்களை (prompts) முயற்சி செய்தேன். பெரும்பாலான முடிவுகள் மோசமாக இருந்தன.
- AI "FIX IT" என்பதை உருக்கியது போன்ற, வாசிக்க முடியாத எழுத்துருவில் உருவாக்கியது.
- அது வார்த்தைகளை "FIXX IT" என்று தவறாக எழுதியது.
- YouTube டைம்ஸ்டாம்ப் (timestamp) மறைக்கும் இடத்தில் அது உரையை வைத்தது.
ஒரு டெவலப்பராக, கருவிகள் தெளிவான பிழைச் செய்திகளுடன் (error messages) தோல்வியடையும் என்று நான் எதிர்பார்க்கிறேன். ஆனால் AI வித்தியாசமாகத் தோல்வியடைகிறது. அது அமைதியாகவும், சீரற்ற முறையிலும் தோல்வியடைகிறது. அங்கு எந்த பிழைப் பதிவும் (error log) இல்லை. ஒவ்வொரு முறையும் உங்களுக்கு ஒரு வித்தியாசமான தவறான பதிலையே கிடைக்கும்.
இந்தப் பிரச்சனை கட்டமைப்பு ரீதியானது (architectural). இமேஜ் மாடல்கள் (Image models) லேஅவுட் என்ஜின்கள் (layout engines) அல்ல. அவற்றுக்கு பவுண்டிங் பாக்ஸ்கள் (bounding boxes) அல்லது உரையின் தெளிவுத்தன்மை (text legibility) பற்றித் தெரியாது. அவை பார்ப்பதற்குச் சரியாகத் தெரியும் ஆனால் சரியாகச் செயல்படாத பிக்சல்களை (pixels) உருவாக்குகின்றன.
பிரத்யேகக் கருவிகள் இதைச் சரிசெய்கிறதா என்று பார்க்க நான் Thumbs.ai-ஐச் சோதித்தேன். அது பின்னணியைத் (background) தனியாகவும், உரையைத் தனியாகவும் பிரிப்பதால் ஒரு முன்னேற்றமாக இருந்தது. இது லேயர்களை (layers) அனுமதிக்கிறது. இருப்பினும், தானியங்கி எழுத்துரு பரிந்துரைகள் (automated font suggestions) அந்தப் படத்தின் காட்சித் தன்மைக்கு (visual mood) பொருத்தமற்றதாகவே இருந்தன.
நான் எனது சிந்தனை முறையை (mental model) மாற்ற வேண்டியிருந்தது.
Text-to-thumbnail கருவிகள் ஒரு 'build pipeline' அல்ல. அவை ஒரு 'scaffolding generator' மட்டுமே. அவை தொடங்குவதற்குப் பயனுள்ளதாக இருக்கும், ஆனால் மனித ஆய்வின்றி (human review) அவற்றை முழுமையான தயாரிப்புத் தரத்திற்கு (production-ready) கொண்டு வர முடியாது.
உண்மையில் வேலை செய்யக்கூடிய பணிப்பாய்வு இவ்வாறு அமைகிறது:
- உயர்தரமான, எழுத்துக்கள் இல்லாத பின்னணித் தட்டுகளை (background plates) உருவாக்க AI-ஐப் பயன்படுத்தவும்.
- அந்தப் பின்னணிகளை உங்கள் சொந்த எடிட்டருக்குள் இறக்குமதி செய்யவும்.
- உங்கள் சொந்த உரை, எழுத்துருக்கள் மற்றும் நிழல்களை (shadows) கைமுறையாகச் சேர்க்கவும்.
இந்த முறை எனக்கு நான்கு நிமிடங்கள் மட்டுமே எடுத்தது. ஸ்டாக் புகைப்படங்களைத் (stock photos) தேடுவதையோ அல்லது சிக்கலான பின்னணிகளை மாஸ்க் (masking) செய்வதையோ விட இது மிக வேகமானது.
படைப்பாளிகளுக்கான (creators) எனது கண்டுபிடிப்புகள்:
- AI என்பது வடிவமைப்பிற்கு மாற்றானது அல்ல. அது மூலப்பொருட்களை (raw material) உருவாக்க உதவும் ஒரு வழி மட்டுமே.
- எழுத்துக்களை உருவாக்குவது (Text rendering) தற்போது நம்பகத்தன்மை அற்றது. உங்கள் எழுத்துரு வடிவமைப்பை நீங்களே கவனித்துக் கொள்ளுங்கள்.
- பின்னணி உருவாக்கம் மற்றும் புதிய கருத்துக்களை (concepts) ஆராய்வதில் தான் உண்மையான மதிப்பு உள்ளது.
AI ஒரு சூழலை (mood) தோராயமாக உருவாக்க முடியும், ஆனால் ஒரு வெற்றிகரமான சூத்திரத்தை (formula) அப்படியே நகலெடுக்க முடியாது. அது சிக்கலின் எளிதான பகுதிகளைத் தீர்க்கிறது, ஆனால் கடினமானவற்றை அல்ல.