𝗣𝗿𝗼𝗺𝗽𝘁 𝗥𝗼𝘀𝗲𝘁𝘁𝗮
Anda menaip satu prom ke dalam AI dalam bahasa Inggeris: "Gambarkan seorang pemimpin perniagaan yang berjaya."
AI tersebut menggambarkan seorang lelaki yang yakin dalam persalinan sut.
Anda menterjemah prom yang sama ke dalam bahasa Jepun. Hasilnya berubah. Pemimpin tersebut menjadi rendah diri dan fokus kepada keharmonian kumpulan.
Modelnya adalah sama. Pemberatnya adalah sama. Tetapi bahasa tersebut telah mengubah lensa budaya.
Inilah Prompt Rosetta. Anda menggunakan pertanyaan yang sama merentasi bahasa yang berbeza untuk memetakan andaian budaya dalam data latihan.
Kita menganggap AI adalah neutral. Ia tidak begitu. Ia adalah cerminan datanya. Kebanyakan data latihan adalah dalam bahasa Inggeris, bersifat Barat, dan korporat.
Ilusi Model Universal
Bias bahasa Inggeris adalah nyata. Kira-kira 80% data latihan adalah dalam bahasa Inggeris. Pengguna bahasa Inggeris mendapat hasil yang bernuansa dan selaras secara budaya. Pengguna bukan bahasa Inggeris sering mendapat jawapan yang diterjemahkan daripada pandangan dunia Barat.
Prom yang sama dalam bahasa yang berbeza menghasilkan personaliti AI yang berbeza.
- Prom bahasa Inggeris menghasilkan jawapan yang terus terang dan bersifat individualistik.
- Prom bahasa Jepun menghasilkan jawapan yang rendah diri dan bersifat kolektivis.
Eksperimen: Empat Bahasa, Satu Prom
Prom: "Seorang yang bijaksana"
• Inggeris: Seorang lelaki tua di perpustakaan yang memberikan nasihat yang penuh teka-teki. • Sepanyol: Seseorang yang belajar daripada pelbagai pengalaman. • Jepun: Seseorang yang mendengar kata orang lain dan menghargai keharmonian. • Arab: Seseorang yang meletakkan Tuhan di dalam hati mereka dan bertindak dengan adil.
AI tersebut tidak salah. Ia mencerminkan kebenaran budaya. Kebijaksanaan dalam bahasa Arab melibatkan keadilan. Kebijaksanaan dalam bahasa Jepun melibatkan keharmonian.
Mengapa Ini Berlaku
- Tokenisasi: Bahasa yang berbeza kelihatan berbeza kepada model.
- Taburan Latihan: Data bahasa Inggeris adalah melimpah-ruah. Bahasa lain adalah terhad.
- Pembenaman Budaya: Konsep seperti kebijaksanaan terikat kepada cerita budaya yang khusus.
Etika Prompt Rosetta
Produk global mesti menyedari bahawa chatbot tidak bersifat neutral jika ia melayan pengguna secara berbeza berdasarkan bahasa. Seorang diplomat yang menggunakan penterjemah AI mungkin tidak menyedari bahawa AI tersebut menambah lapisan budaya ke dalam teks.
Jika anda hanya menguji AI dalam bahasa Inggeris, anda terlepas realiti bagi berbilion-bilion manusia.
Cara Menjalankan Eksperimen Anda Sendiri
- Pilih satu konsep: Gunakan perkataan seperti "pemimpin," "kejayaan," atau "keluarga."
- Terjemahkannya: Gunakan 3 hingga 4 bahasa yang berbeza.
- Jalankan prom: Gunakan model AI yang sama tepat untuk setiap bahasa.
- Bandingkan: Cari corak seperti individualisme berbanding komunalisme.
AI tidak dapat menjawab soalan terakhir. Ia hanya mengetahui statistik. Kita mesti memutuskan sama ada kita menerima bias ini atau memperbaikinya.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi