GPT Image 2: Node pipeline mana yang dihilangkan?
Berhentilah melihat demo yang indah. Demo tidak menentukan keputusan build.
Sebagai seorang builder, saya mengabaikan hype. Saya hanya mengajukan satu pertanyaan: node mana yang dihapus oleh model baru ini dari pipeline saya?
Generasi gambar adalah rangkaian langkah. Anda menghasilkan base. Anda memperbaiki teks. Anda melakukan komposisi produk. Anda menghapus latar belakang. Setiap langkah adalah sebuah node. Setiap node adalah biaya dan tempat di mana masalah bisa muncul.
Saya melihat GPT Image 2 melalui lensa ini. Berikut adalah apa yang menjadi targetnya dan cara mengujinya sendiri.
Catatan: Saya menggunakan platform pihak ketiga untuk mengakses ini. Verifikasi identitas model dan lisensinya terhadap dokumentasi OpenAI sebelum Anda melakukan build.
Dua fitur yang benar-benar penting bagi alur kerja Anda:
Node 1: Referensi yang konsisten. Alih-alih menggunakan ControlNet atau komposisi manual untuk menjaga agar produk terlihat sama, model ini menggabungkan hingga 16 referensi. Jika ia mampu mempertahankan identitas, ia menghapus node komposisi.
Node 2: Teks di dalam gambar. Sebagian besar model gagal dalam tipografi. Hal ini memaksa Anda menggunakan Figma atau Canva untuk melakukan overlay teks. Jika model ini merender headline yang terbaca dalam bahasa Inggris atau Jepang, ia menghapus node overlay.
Jangan percaya begitu saja pada analisis saya. Jalankan tes tiga tugas ini sendiri:
Tugas 1: Reference Fusion
- Input: 3 foto produk + 1 foto latar belakang.
- Prompt: "Place this product in this scene, studio lighting, keep the label exact."
- Periksa: Apakah produk tetap sama atau berubah (drift)?
Tugas 2: In-image Text
- Prompt: "Poster with headline 'Summer Sale' in English and Japanese."
- Periksa: Apakah teksnya terbaca dan dieja dengan benar dalam kedua aksara tersebut?
Tugas 3: Natural-language Edit
- Input: Gambar dari Tugas 1.
- Prompt: "Change to evening light, keep the product unchanged."
- Periksa: Apakah subjek tetap sama sementara pemandangannya berubah?
Berikan skor sebagai Pass, Partial, atau Fail. Satu-satunya metrik yang penting adalah: "Apakah ini menghapus sebuah node pipeline?"
Perlu diingat apa yang TIDAK dilakukan oleh model ini:
- Ia tidak menyediakan PNG transparan. Anda tetap membutuhkan node penghapus latar belakang.
- Ia menggunakan watermark SynthID.
- Ia menggunakan sistem kredit. Volume tinggi mungkin lebih murah pada model lain.
- Ia bersifat hosted. Anda tidak dapat melakukan self-host untuk penggunaan pribadi atau offline.
Tujuannya bukan untuk menemukan model terbaik. Tujuannya adalah menemukan model yang merampingkan alur kerja Anda.
Node mana dalam pipeline Anda yang paling banyak memakan waktu?
Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi
