Il Rosetta Prompt
Scrivi un prompt a un'IA in inglese: "Descrivi un leader aziendale di successo."
L'IA descrive un uomo sicuro di sé in abito elegante.
Traduci lo stesso prompt in giapponese. Il risultato cambia. Il leader diventa umile e concentrato sull'armonia del gruppo.
Il modello è lo stesso. I pesi sono gli stessi. Ma la lingua ha cambiato la lente culturale.
Questo è il Rosetta Prompt. Utilizzi la stessa query in diverse lingue per mappare i presupposti culturali nei dati di addestramento.
Presumiamo che l'IA sia neutrale. Non lo è. È uno specchio dei suoi dati. La maggior parte dei dati di addestramento è in inglese, occidentale e aziendale.
L'illusione di un modello universale
Il bias linguistico inglese è reale. Circa l'80% dei dati di addestramento è in inglese. Gli utenti anglofoni ottengono output sfumati e culturalmente allineati. Gli utenti non anglofoni ricevono spesso risposte tradotte da una visione del mondo occidentale.
Lo stesso prompt in lingue diverse crea diverse personalità dell'IA.
- I prompt in inglese producono risposte dirette e individualiste.
- I prompt in giapponese producono risposte umili e collettiviste.
L'esperimento: quattro lingue, un prompt
Prompt: "Una persona saggia"
• Inglese: Un uomo anziano in una biblioteca che dà consigli criptici. • Spagnolo: Una persona che impara da molte esperienze. • Giapponese: Una persona che ascolta gli altri e valorizza l'armonia. • Arabo: Una persona che porta Dio nel cuore e agisce con giustizia.
L'IA non sbaglia. Sta riflettendo verità culturali. La saggezza in arabo implica la giustizia. La saggezza in giapponese implica l'armonia.
Perché accade questo
- Tokenizzazione: Lingue diverse appaiono diverse al modello.
- Distribuzione dell'addestramento: I dati in inglese sono abbondanti. Le altre lingue sono scarse.
- Embedding culturale: Concetti come la saggezza sono legati a specifiche narrazioni culturali.
L'etica del Rosetta Prompt
I prodotti globali devono rendersi conto che un chatbot non è neutrale se tratta gli utenti in modo diverso in base alla lingua. Un diplomatico che utilizza un traduttore IA potrebbe non sapere che l'IA sta aggiungendo strati culturali al testo.
Se testi l'IA solo in inglese, ignori la realtà di miliardi di persone.
Come condurre il tuo esperimento
- Scegli un concetto: Usa parole come "leader", "successo" o "famiglia".
- Traducilo: Usa da 3 a 4 lingue diverse.
- Esegui i prompt: Usa esattamente lo stesso modello di IA per ogni lingua.
- Confronta: Cerca schemi come l'individualismo rispetto al comunitarismo.
L'IA non può rispondere alla domanda finale. Conosce solo le statistiche. Dobbiamo decidere se accettare questo bias o correggerlo.
Community di apprendimento opzionale: https://t.me/GyaanSetuAi