The Rosetta Prompt
మీరు ఒక AIలో ఇంగ్లీష్లో ఒక ప్రాంప్ట్ను టైప్ చేస్తారు: "ఒక విజయవంతమైన వ్యాపార నాయకుడిని వివరించండి."
AI సూట్ ధరించిన ఒక ఆత్మవిశ్వాసం ఉన్న వ్యక్తిని వివరిస్తుంది.
మీరు అదే ప్రాంప్ట్ను జపనీస్లోకి అనువదిస్తారు. ఫలితం మారుతుంది. ఆ నాయకుడు వినయపూర్వకమైన వ్యక్తిగా మరియు సమూహ సామర్యంపై దృష్టి సారించే వ్యక్తిగా మారుతాడు.
మోడల్ ఒక్కటే. వెయిట్స్ (weights) కూడా ఒక్కటే. కానీ భాష సాంస్కృతిక దృక్పథాన్ని మార్చేసింది.
ఇదే 'రోసెట్టా ప్రాంప్ట్' (Rosetta Prompt). శిక్షణ డేటాలోని (training data) సాంస్కృతిక ఊహలను గుర్తించడానికి మీరు వివిధ భాషలలో ఒకే ప్రశ్నను ఉపయోగిస్తారు.
AI తటస్థంగా ఉంటుందని మనం అనుకుంటాము. కానీ అది కాదు. అది దాని డేటా యొక్క ప్రతిబింబం. చాలా శిక్షణ డేటా ఇంగ్లీష్, పాశ్చాత్య మరియు కార్పొరేట్ శైలిలో ఉంటుంది.
ఒక సార్వత్రిక మోడల్ యొక్క భ్రమ (The Illusion of a Universal Model)
ఇంగ్లీష్ పక్షపాతం నిజం. శిక్షణ డేటాలో సుమారు 80% ఇంగ్లీష్లో ఉంది. ఇంగ్లీష్ వినియోగదారులు సూక్ష్మమైన మరియు సాంస్కృతిక అనుగుణ్యత కలిగిన అవుట్పుట్లను పొందుతారు. ఇంగ్లీష్ కాని వినియోగదారులు తరచుగా పాశ్చాత్య ప్రపంచ దృక్పథం నుండి అనువదించబడిన సమాధానాలను పొందుతారు.
వివిధ భాషలలో ఒకే ప్రాంప్ట్ వేర్వేరు AI వ్యక్తిత్వాలను సృష్టిస్తుంది.
- ఇంగ్లీష్ ప్రాంప్ట్లు ప్రత్యక్ష మరియు వ్యక్తిగతమైన సమాధానాలను ఇస్తాయి.
- జపనీస్ ప్రాంప్ట్లు వినయపూర్వకమైన మరియు సామూహిక సమాధానాలను ఇస్తాయి.
ప్రయోగం: నాలుగు భాషలు, ఒకే ప్రాంప్ట్
ప్రాంప్ట్: "ఒక జ్ఞాని" (A wise person)
• ఇంగ్లీష్: లైబ్రరీలో రహస్యమైన సలహాలు ఇస్తున్న ఒక వృద్ధుడు. • స్పానిష్: అనేక అనుభవాల నుండి నేర్చుకునే వ్యక్తి. • జపనీస్: ఇతరుల మాటలు వినే మరియు సామర్యాన్ని గౌరవించే వ్యక్తి. • అరబిక్: దైవాన్ని హృదయంలో ఉంచుకుని, న్యాయంగా వ్యవహరించే వ్యక్తి.
AI తప్పు చేయడం లేదు. అది సాంస్కృతిక సత్యాలను ప్రతిబింబిస్తోంది. అరబిక్లో జ్ఞానం అంటే న్యాయం. జపనీస్లో జ్ఞానం అంటే సామర్యం.
ఇది ఎందుకు జరుగుతుంది
- టోకనైజేషన్ (Tokenization): మోడల్కు వివిధ భాషలు వేర్వేరుగా కనిపిస్తాయి.
- శిక్షణ పంపిణీ (Training Distribution): ఇంగ్లీష్ డేటా పుష్కలంగా ఉంది. ఇతర భాషలు తక్కువగా ఉన్నాయి.
- సాంస్కృతిక ఎంబెడ్డింగ్ (Cultural Embedding): జ్ఞానం వంటి భావనలు నిర్దిష్ట సాంస్కృతిక కథలతో ముడిపడి ఉంటాయి.
రోసెట్టా ప్రాంప్ట్ యొక్క నైతికత (The Ethics of the Rosetta Prompt)
భాష ఆధారంగా వినియోగదారులను భిన్నంగా చూస్తే, చాట్బాట్ తటస్థంగా లేదని గ్లోబల్ ప్రొడక్ట్స్ గుర్తించాలి. AI ట్రాన్స్లేటర్ను ఉపయోగించే ఒక దౌత్యవేత్త, AI టెక్స్ట్కు సాంస్కృతిక పొరలను (cultural layers) జోడిస్తోందని తెలియకపోవచ్చు.
మీరు AIని కేవలం ఇంగ్లీష్లో మాత్రమే పరీక్షించినట్లయితే, బిలియన్ల మంది ప్రజల వాస్తవికతను మీరు కోల్పోతారు.
మీ స్వంత ప్రయోగాన్ని ఎలా నిర్వహించాలి
- ఒక భావనను ఎంచుకోండి: "నాయకుడు," "విజయం," లేదా "కుటుంబం" వంటి పదాలను ఉపయోగించండి.
- దానిని అనువదించండి: 3 నుండి 4 వేర్వేరు భాషలను ఉపయోగించండి.
- ప్రాంప్ట్లను రన్ చేయండి: ప్రతి భాషకు ఖచ్చితంగా ఒకే AI మోడల్ను ఉపయోగించండి.
- పోల్చండి: వ్యక్తివాదం (individualism) వర్సెస్ సామూహికత (communalism) వంటి నమూనాలను గమనించండి.
AI చివరి ప్రశ్నను సమాధానం చేయలేదు. దానికి కేవలం గణాంకాలు మాత్రమే తెలుసు. మనం ఈ పక్షపాతాన్ని అంగీకరించాలా లేదా సరిదిద్దాలా అనేది నిర్ణయించుకోవాలి.
ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi