Memecahkan Minda Kolektif AI: Bagaimana Flint Menangani Pemikiran Kumpulan LLM
Walaupun model bahasa besar seperti ChatGPT dan Claude cemerlang dalam pengkodan dan penyelidikan, mereka semakin terperangkap dalam jerat "pemikiran kumpulan" (groupthink) yang mudah diramal. Memandangkan model arus perdana semakin tertumpu kepada respons berulang dengan kebarangkalian tinggi, sebuah syarikat pemula baharu sedang cuba menyuntik kepelbagaian yang amat diperlukan ke dalam ekosistem AI generatif.
Masalah: Kesan "Minda Kolektif Buatan"
Satu had yang ketara dalam pembangunan LLM semasa ialah kecenderungan model untuk tertarik kepada jawapan yang paling berkemungkinan secara statistik, yang membawa kepada fenomena yang dipanggil penyelidik sebagai "Minda Kolektif Buatan" (Artificial Hivemind). Sebuah kertas kerja pemenang anugerah NeurIPS, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” mendedahkan pengulangan yang mendalam ini.
Pasukan penyelidik menguji 25 LLM yang berbeza, termasuk model utama dari AS dan versi sumber terbuka dari China. Apabila diminta untuk memberikan metafora bagi "masa", sebahagian besar daripada 1,250 respons tertumpu kepada klise seperti "Time is a river" atau "Time is a weaver". Kekurangan kepelbagaian ini bukan sekadar keunikan kecil; ia adalah hasil sampingan daripada latihan model menggunakan set data yang serupa dengan matlamat utama untuk memaksimumkan kebolehpercayaan dan koheren. OpenAI telah mengakui bahawa usaha mengejar kebaharuan kadangkala boleh membawa kepada respons yang lebih lemah dan kurang boleh dipercayai, itulah sebabnya kebanyakan model memilih output "kebarangkalian tinggi" yang selamat secara lalai.
Memperkenalkan Flint: Mengutamakan Kepelbagaian Berbanding Kebolehramalan
Syarikat pemula Australia, Springboards, sedang mencabar status quo ini dengan model baharunya, Flint. Tidak seperti model arus perdana yang melawan halusinasi pada apa jua kos, CEO Springboards, Pip Bingemann, berhujah bahawa tahap perbezaan yang tidak dapat diramal adalah perlu untuk tugasan kreatif.
Dalam ujian praktikal, perbezaan dalam taburan output adalah sangat ketara:
- Rawak: Apabila diminta nombor rawak, ChatGPT dan Claude sering memilih "7" secara lalai, manakala Flint memberikan nombor bukan standard dengan ketepatan tinggi seperti "3.7916".
- Penjenamaan Kreatif: Apabila diminta untuk slogan New Balance, Claude dan ChatGPT kedua-duanya menghasilkan "Run your way", manakala Flint menawarkan alternatif yang berbeza: "Built to last, run to win".
- Pemilihan Kata Nama: Di mana model arus perdana cenderung kepada jenama "selamat" seperti Toyota atau Honda, Flint menunjukkan julat yang lebih luas, memilih pilihan yang kurang dapat diramal seperti Ford F-150.
Alat Kreatif untuk Profesional
Springboards bukan sekadar membina model berdiri sendiri; mereka sedang membangunkan alat khusus untuk profesional pengiklanan dan pemasaran. Platform ini membolehkan pengguna mengumpulkan output daripada pelbagai model—termasuk ChatGPT dan Claude—dan menggabungkannya untuk mensintesis idea baharu. Flint berfungsi sebagai "pelontar kreatif" (creative catapult) dalam ekosistem ini, yang direka khusus untuk mendorong pengguna keluar daripada kerangka pemikiran sedia ada mereka.
Zoe Scaman, Ketua Pegawai Strategi di 77X, menyatakan bahawa walaupun model arus perdana sering mencadangkan penyelesaian yang sama dan membosankan (seperti "mengajar literasi kewangan dengan cara yang menyeronokkan"), Flint memberikan anjakan perspektif yang radikal, seperti mencadangkan penjenamaan semula sepenuhnya terhadap konsep pengumpulan kekayaan itu sendiri.
Rumusan Utama
- Homogeniti LLM: Model-model utama semakin tertumpu kepada jawapan yang serupa dan boleh diramal disebabkan metodologi latihan yang serupa, mewujudkan kesan "Minda Kolektif Buatan".
- Pendekatan Flint: Model Flint oleh Springboards mengutamakan kepelbagaian dan perbezaan respons, menjadikannya lebih sesuai untuk sumbang saran (brainstorming) dan strategi kreatif berbanding model standard.
- Pertukaran Kebolehpercayaan: Industri menghadapi ketegangan asas antara kebolehpercayaan model (kekal dalam lingkungan kebarangkalian tinggi) dan kebaharuan kreatif (menerima output yang pelbagai dengan kebarangkalian lebih rendah).
