𝗠𝗼𝗱𝗲𝗹 𝗕𝗮𝗵𝗮𝘀𝗮 𝗕𝗼𝗹𝗲𝗵 𝗠𝗲𝗹𝗶𝗵𝗮𝘁

Model teks sering bergelut dengan susun atur visual. Ia menulis perkataan tetapi tidak memahami bagaimana perkataan tersebut kelihatan pada skrin.

Penyelidikan baharu mengubah perkara ini. Kini anda boleh menyepadukan kawalan visual ke dalam penjanaan teks. Ini membolehkan model melihat semasa ia menulis.

Cara ia berfungsi:

  • Model menerima maklum balas visual semasa proses tersebut.
  • Ia melaraskan teks untuk memuatkan susun atur tertentu.
  • Ia menghubungkan makna linguistik dengan penempatan ruang.

Ini menambah baik cara AI mengendalikan data berstruktur. Ia membantu dalam reka bentuk UI dan pemformatan dokumen.

Anda tidak lagi perlu memisahkan model teks daripada alatan visual. Anda boleh menggunakan satu sistem untuk menguruskan kedua-duanya.

Sumber: https://dev.to/paperium/language-models-can-see-plugging-visual-controls-in-text-generation-aml

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi