𝗧𝗵𝗲 𝗥𝗼𝘀𝗲𝘁𝘁𝗮 𝗣𝗿𝗼𝗺𝗽𝘁
Wpisujesz prompt do AI w języku angielskim: „Opisz odnoszącego sukcesy lidera biznesu”.
AI opisuje pewnego siebie mężczyznę w garniturze.
Tłumaczysz ten sam prompt na język japoński. Wynik się zmienia. Lider staje się skromny i skupiony na harmonii grupowej.
Model jest ten sam. Wagi są te same. Ale język zmienił kulturową perspektywę.
To jest Rosetta Prompt. Używasz tego samego zapytania w różnych językach, aby zmapować założenia kulturowe w danych treningowych.
Zakładamy, że AI jest neutralne. Nie jest. Jest lustrem swoich danych. Większość danych treningowych jest anglojęzyczna, zachodnia i korporacyjna.
The Illusion of a Universal Model
Stronniczość anglojęzyczna jest realna. Około 80% danych treningowych jest w języku angielskim. Użytkownicy anglojęzyczni otrzymują niuansowe i spójne kulturowo odpowiedzi. Użytkownicy nieanglojęzyczni często otrzymują odpowiedzi przetłumaczone z zachodniego punktu widzenia.
Ten sam prompt w różnych językach tworzy różne osobowości AI.
- Prompty w języku angielskim dają bezpośrednie i indywidualistyczne odpowiedzi.
- Prompty w języku japońskim dają skromne i kolektywistyczne odpowiedzi.
The Experiment: Four Languages, One Prompt
Prompt: „Mądra osoba”
• Angielski: Starszy mężczyzna w bibliotece udzielający enigmatycznych rad. • Hiszpański: Osoba, która uczy się na podstawie wielu doświadczeń. • Japoński: Osoba, która słucha innych i ceni harmonię. • Arabski: Osoba, która nosi Boga w swoim sercu i działa sprawiedliwie.
AI nie błądzi. Odzwierciedla prawdy kulturowe. Mądrość w języku arabskim wiąże się ze sprawiedliwością. Mądrość w języku japońskim wiąże się z harmonią.
Why This Happens
- Tokenizacja: Różne języki wyglądają dla modelu inaczej.
- Rozkład danych treningowych: Dane angielskie są obfite. Inne języki są rzadkie.
- Osadzenie kulturowe: Pojęcia takie jak mądrość są powiązane z konkretnymi opowieściami kulturowymi.
The Ethics of the Rosetta Prompt
Produkty globalne muszą zrozumieć, że chatbot nie jest neutralny, jeśli traktuje użytkowników inaczej w zależności od języka. Dyplomata korzystający z tłumacza AI może nie wiedzieć, że AI dodaje do tekstu warstwy kulturowe.
Jeśli testujesz AI tylko w języku angielskim, umyka Ci rzeczywistość miliardów ludzi.
How to Run Your Own Experiment
- Wybierz koncepcję: Użyj słów takich jak „lider”, „sukces” lub „rodzina”.
- Przetłumacz ją: Użyj 3 do 4 różnych języków.
- Uruchom prompty: Użyj dokładnie tego samego modelu AI dla każdego języka.
- Porównaj: Szukaj wzorców, takich jak indywidualizm kontra kolektywizm.
AI nie potrafi odpowiedzieć na końcowe pytanie. Zna ona jedynie statystykę. Musimy zdecydować, czy akceptujemy tę stronniczość, czy ją naprawimy.
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi