GPT Image 2: இது எந்த pipeline node-ஐ நீக்குகிறது?
அழகான டெமோக்களைப் பார்ப்பதை நிறுத்துங்கள். டெமோக்கள் உருவாக்க முடிவுகளை எடுக்க உதவாது.
ஒரு உருவாக்குநராக (builder), நான் விளம்பரங்களை (hype) கண்டு கொள்ள மாட்டேன். நான் ஒரே ஒரு கேள்வியைக் கேட்பேன்: இந்த புதிய மாடல் எனது பணிப்பாய்விலிருந்து (pipeline) எந்த முனையை (node) நீக்குகிறது?
பட உருவாக்கம் என்பது தொடர்ச்சியான படிகளின் சங்கிலித் தொடர் ஆகும். நீங்கள் ஒரு அடிப்படையை (base) உருவாக்குகிறீர்கள். உரையைச் சரிசெய்கிறீர்கள். ஒரு பொருளை இணைக்கிறீர்கள் (composite). பின்னணியை நீக்குகிறீர்கள். ஒவ்வொரு படியும் ஒரு முனை (node). ஒவ்வொரு முனையும் ஒரு செலவு மற்றும் பிழைகள் ஏற்படக்கூடிய இடமாகும்.
நான் GPT Image 2-ஐ இந்தத் தேடலின் மூலம் பார்த்தேன். இது எவற்றை இலக்காகக் கொண்டுள்ளது மற்றும் அதை நீங்களே எவ்வாறு சோதிப்பது என்பது இதோ.
குறிப்பு: இதை அணுக நான் ஒரு மூன்றாம் தரப்பு தளத்தைப் பயன்படுத்துகிறேன். நீங்கள் உருவாக்குவதற்கு முன், OpenAI ஆவணங்களுடன் மாடலின் அடையாளம் மற்றும் உரிமத்தைச் சரிபார்க்கவும்.
உங்கள் பணிப்பாய்விற்கு (workflow) உண்மையில் முக்கியத்துவம் வாய்ந்த இரண்டு அம்சங்கள்:
முனை 1: நிலையான குறிப்புகள் (Consistent references). ஒரு பொருளை ஒரே மாதிரியாக வைத்திருக்க ControlNet அல்லது கைமுறை இணைப்பைப் (manual compositing) பயன்படுத்துவதற்குப் பதிலாக, இந்த மாடல் 16 குறிப்புகள் வரை இணைக்கிறது. இது அடையாளத்தைத் தக்கவைத்தால், அது இணைக்கும் முனையை (compositing node) நீக்கிவிடும்.
முனை 2: படத்திற்குள் உரை (In-image text). பெரும்பாலான மாடல்கள் எழுத்துரு அமைப்பில் (typography) தோல்வியடைகின்றன. இது உரையை மேலடுக்கு செய்ய (overlay) Figma அல்லது Canva ஆகியவற்றைப் பயன்படுத்த உங்களைத் தூண்டுகிறது. இந்த மாடல் ஆங்கிலம் அல்லது ஜப்பானிய மொழியில் தெளிவான தலைப்புகளை உருவாக்கினால், அது மேலடுக்கு முனையை (overlay node) நீக்கிவிடும்.
எனது கணிப்பை மட்டும் நம்பாதீர்கள். இதை நீங்களே இந்த மூன்று வேலைத் தேர்வின் மூலம் செய்து பாருங்கள்:
வேலை 1: குறிப்பு இணைத்தல் (Reference Fusion)
- உள்ளீடு: 3 தயாரிப்புப் படங்கள் + 1 பின்னணிப் படம்.
- தூண்டுதல் (Prompt): "Place this product in this scene, studio lighting, keep the label exact."
- சரிபார்த்தல்: தயாரிப்பு அப்படியே இருக்கிறதா அல்லது மாறுகிறதா?
வேலை 2: படத்திற்குள் உரை (In-image Text)
- தூண்டுதல் (Prompt): "Poster with headline 'Summer Sale' in English and Japanese."
- சரிபார்த்தல்: இரண்டு மொழிகளிலும் உரை தெளிவாகவும், எழுத்துப்பிழையின்றித் தெரிகிறதா?
வேலை 3: இயற்கை மொழித் திருத்தம் (Natural-language Edit)
- உள்ளீடு: வேலை 1-லிருந்து பெறப்பட்ட படம்.
- தூண்டுதல் (Prompt): "Change to evening light, keep the product unchanged."
- சரிபார்த்தல்: சூழல் மாறும்போது பொருள் அப்படியே இருக்கிறதா?
இவற்றை Pass, Partial, அல்லது Fail என மதிப்பிடுங்கள். "இது ஒரு pipeline node-ஐ நீக்குகிறதா?" என்பது மட்டுமே முக்கியமான அளவுகோல்.
இந்த மாடல் எதைச் செய்யாது என்பதையும் நினைவில் கொள்ளுங்கள்:
- இது வெளிப்படையான (transparent) PNG-களை வழங்காது. உங்களுக்கு இன்னும் பின்னணி நீக்கும் முனை (background removal node) தேவைப்படும்.
- இது SynthID வாட்டர்மார்க்குகளைப் பயன்படுத்துகிறது.
- இது கிரெடிட் அடிப்படையிலானது (credit-metered). அதிக அளவிலான பயன்பாட்டிற்கு மற்ற மாடல்கள் மலிவாக இருக்கலாம்.
- இது ஹோஸ்ட் செய்யப்பட்டுள்ளது (hosted). தனிப்பட்ட அல்லது ஆஃப்லைன் பயன்பாட்டிற்காக இதை உங்களால் சொந்தமாக ஹோஸ்ட் செய்ய முடியாது.
சிறந்த மாடலைக் கண்டறிவது இலக்கல்ல. உங்கள் பணிப்பாய்வை (workflow) சுருக்குகின்ற மாடலைக் கண்டறிவதே இலக்கு.
உங்கள் பணிப்பாய்வில் எந்த முனை அதிக நேரத்தை எடுத்துக் கொள்கிறது?
விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi
