ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್ (The Rosetta Prompt)
ನೀವು AI ಗೆ ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ ಒಂದು ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಟೈಪ್ ಮಾಡುತ್ತೀರಿ: "ಒಬ್ಬ ಯಶಸ್ವಿ ವ್ಯವಹಾರ ನಾಯಕನನ್ನು ವಿವರಿಸಿ."
AI ಸೂಟ್ ಧರಿಸಿದ ಆತ್ಮವಿಶ್ವಾಸವುಳ್ಳ ವ್ಯಕ್ತಿಯನ್ನು ವಿವರಿಸುತ್ತದೆ.
ನೀವು ಅದೇ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಜಪಾನೀಸ್ ಭಾಷೆಗೆ ಅನುವಾದಿಸುತ್ತೀರಿ. ಆಗ ಔಟ್ಪುಟ್ ಬದಲಾಗುತ್ತದೆ. ಆ ನಾಯಕನು ವಿನಮ್ರನಾಗಿ ಮತ್ತು ಗುಂಪಿನ ಸಾಮರಸ್ಯದ ಮೇಲೆ ಗಮನ ಹರಿಸುವವನಾಗಿ ಬದಲಾಗುತ್ತಾನೆ.
ಮಾಡೆಲ್ ಒಂದೇ ಆಗಿದೆ. ತೂಕಗಳು (weights) ಒಂದೇ ಆಗಿವೆ. ಆದರೆ ಭಾಷೆಯು ಸಾಂಸ್ಕೃತಿಕ ದೃಷ್ಟಿಕೋನವನ್ನು ಬದಲಾಯಿಸಿದೆ.
ಇದನ್ನೇ ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್ (Rosetta Prompt) ಎನ್ನಲಾಗುತ್ತದೆ. ತರಬೇತಿ ದತ್ತಾಂಶದಲ್ಲಿರುವ (training data) ಸಾಂಸ್ಕೃತಿಕ ಕಲ್ಪನೆಗಳನ್ನು ಗುರುತಿಸಲು ನೀವು ವಿವಿಧ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೇ ಪ್ರಶ್ನೆಯನ್ನು ಬಳಸುತ್ತೀರಿ.
AI ತಟಸ್ಥವಾಗಿದೆ ಎಂದು ನಾವು ಭಾವಿಸುತ್ತೇವೆ. ಆದರೆ ಅದು ತಟಸ್ಥವಲ್ಲ. ಅದು ತನ್ನ ದತ್ತಾಂಶದ ಪ್ರತಿಬಿಂಬವಾಗಿದೆ. ಹೆಚ್ಚಿನ ತರಬೇತಿ ದತ್ತಾಂಶವು ಇಂಗ್ಲಿಷ್, ಪಾಶ್ಚಾತ್ಯ ಮತ್ತು ಕಾರ್ಪೊರೇಟ್ ಶೈಲಿಯದ್ದಾಗಿದೆ.
ಸಾರ್ವತ್ರಿಕ ಮಾಡೆಲ್ ಎಂಬ ಭ್ರಮೆ
ಇಂಗ್ಲಿಷ್ ಪಕ್ಷಪಾತವು ವಾಸ್ತವವಾಗಿದೆ. ಸುಮಾರು 80% ತರಬೇತಿ ದತ್ತಾಂಶವು ಇಂಗ್ಲಿಷ್ನಲ್ಲಿದೆ. ಇಂಗ್ಲಿಷ್ ಬಳಕೆದಾರರು ಸೂಕ್ಷ್ಮ ಮತ್ತು ಸಾಂಸ್ಕೃತಿಕವಾಗಿ ಹೊಂದಾಣಿಕೆಯಾದ ಔಟ್ಪುಟ್ಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ. ಇಂಗ್ಲಿಷ್ ಅಲ್ಲದ ಬಳಕೆದಾರರು ಹೆಚ್ಚಾಗಿ ಪಾಶ್ಚಾತ್ಯ ದೃಷ್ಟಿಕೋನದಿಂದ ಅನುವಾದಿತವಾದ ಉತ್ತರಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ.
ವಿವಿಧ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೇ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಬಳಸಿದಾಗ ವಿಭಿನ್ನ AI ವ್ಯಕ್ತಿತ್ವಗಳು ಸೃಷ್ಟಿಯಾಗುತ್ತವೆ.
- ಇಂಗ್ಲಿಷ್ ಪ್ರಾಂಪ್ಟ್ಗಳು ನೇರ ಮತ್ತು ವೈಯಕ್ತಿಕವಾದ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತವೆ.
- ಜಪಾನೀಸ್ ಪ್ರಾಂಪ್ಟ್ಗಳು ವಿನಮ್ರ ಮತ್ತು ಸಾಮೂಹಿಕವಾದ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತವೆ.
ಪ್ರಯೋಗ: ನಾಲ್ಕು ಭಾಷೆಗಳು, ಒಂದು ಪ್ರಾಂಪ್ಟ್
ಪ್ರಾಂಪ್ಟ್: "ಒಬ್ಬ ಜ್ಞಾನಿ ವ್ಯಕ್ತಿ"
• ಇಂಗ್ಲಿಷ್: ಗ್ರಂಥಾಲಯದಲ್ಲಿ ನಿಗೂಢ ಸಲಹೆ ನೀಡುತ್ತಿರುವ ವಯಸ್ಸಾದ ವ್ಯಕ್ತಿ. • ಸ್ಪ್ಯಾನಿಷ್: ಅನೇಕ ಅನುಭವಗಳಿಂದ ಕಲಿಯುವ ವ್ಯಕ್ತಿ. • ಜಪಾನೀಸ್: ಇತರರ ಮಾತುಗಳನ್ನು ಆಲಿಸುವ ಮತ್ತು ಸಾಮರಸ್ಯಕ್ಕೆ ಮೌಲ್ಯ ನೀಡುವ ವ್ಯಕ್ತಿ. • ಅರೇಬಿಕ್: ಹೃದಯದಲ್ಲಿ ದೇವರನ್ನು ಇಟ್ಟುಕೊಂಡು ನ್ಯಾಯಯುತವಾಗಿ ವರ್ತಿಸುವ ವ್ಯಕ್ತಿ.
AI ತಪ್ಪಾಗಿಲ್ಲ. ಅದು ಸಾಂಸ್ಕೃತಿಕ ಸತ್ಯಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತಿದೆ. ಅರೇಬಿಕ್ನಲ್ಲಿ ಜ್ಞಾನವು ನ್ಯಾಯವನ್ನು ಒಳಗೊಂಡಿದೆ. ಜಪಾನೀಸ್ನಲ್ಲಿ ಜ್ಞಾನವು ಸಾಮರಸ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ.
ಇದು ಏಕೆ ಸಂಭವಿಸುತ್ತದೆ
- ಟೋಕನೈಸೇಶನ್ (Tokenization): ವಿವಿಧ ಭಾಷೆಗಳು ಮಾಡೆಲ್ಗೆ ವಿಭಿನ್ನವಾಗಿ ಕಾಣಿಸುತ್ತವೆ.
- ತರಬೇತಿ ವಿತರಣೆ (Training Distribution): ಇಂಗ್ಲಿಷ್ ದತ್ತಾಂಶವು ಹೇರಳವಾಗಿದೆ. ಇತರ ಭಾಷೆಗಳು ಕಡಿಮೆ ಇವೆ.
- ಸಾಂಸ್ಕೃತಿಕ ಎಂಬೆಡ್ಡಿಂಗ್ (Cultural Embedding): ಜ್ಞಾನದಂತಹ ಪರಿಕಲ್ಪನೆಗಳು ನಿರ್ದಿಷ್ಟ ಸಾಂಸ್ಕೃತಿಕ ಕಥೆಗಳಿಗೆ ಸಂಬಂಧಿಸಿವೆ.
ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್ನ ನೈತಿಕತೆ
ಭಾಷೆಯ ಆಧಾರದ ಮೇಲೆ ಬಳಕೆದಾರರನ್ನು ವಿಭಿನ್ನವಾಗಿ ನಡೆಸಿಕೊಳ್ಳುವ ಚಾಟ್ಬಾಟ್ ತಟಸ್ಥವಲ್ಲ ಎಂಬುದು ಜಾಗತಿಕ ಉತ್ಪನ್ನಗಳಿಗೆ ತಿಳಿದಿರಬೇಕು. AI ಅನುವಾದಕನನ್ನು ಬಳಸುವ ರಾಜತಾಂತ್ರಿಕರಿಗೆ, AI ಪಠ್ಯಕ್ಕೆ ಸಾಂಸ್ಕೃತಿಕ ಪದರಗಳನ್ನು ಸೇರಿಸುತ್ತಿದೆ ಎಂಬುದು ತಿಳಿಯದಿರಬಹುದು.
ನೀವು AI ಅನ್ನು ಕೇವಲ ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ ಮಾತ್ರ ಪರೀಕ್ಷಿಸಿದರೆ, ಶತಕೋಟಿ ಜನರ ವಾಸ್ತವವನ್ನು ನೀವು ಕಳೆದುಕೊಳ್ಳುತ್ತೀರಿ.
ನಿಮ್ಮದೇ ಆದ ಪ್ರಯೋಗವನ್ನು ಮಾಡುವುದು ಹೇಗೆ
- ಒಂದು ಪರಿಕಲ್ಪನೆಯನ್ನು ಆರಿಸಿ: "leader," "success," ಅಥವಾ "family" ಎಂಬ ಪದಗಳನ್ನು ಬಳಸಿ.
- ಅದನ್ನು ಅನುವಾದಿಸಿ: 3 ರಿಂದ 4 ವಿಭಿನ್ನ ಭಾಷೆಗಳನ್ನು ಬಳಸಿ.
- ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಚಲಾಯಿಸಿ: ಪ್ರತಿಯೊಂದು ಭಾಷೆಗೂ ಒಂದೇ ರೀತಿಯ AI ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸಿ.
- ಹೋಲಿಸಿ: ವೈಯಕ್ತಿಕವಾದ ಮತ್ತು ಸಾಮೂಹಿಕತೆಯಂತಹ ಮಾದರಿಗಳನ್ನು ಗಮನಿಸಿ.
AI ಅಂತಿಮ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಅದಕ್ಕೆ ಕೇವಲ ಅಂಕಿಅಂಶಗಳು ಮಾತ್ರ ತಿಳಿದಿವೆ. ನಾವು ಈ ಪೂರ್ವಾಗ್ರಹವನ್ನು ಒಪ್ಪಿಕೊಳ್ಳಬೇಕೆ ಅಥವಾ ಅದನ್ನು ಸರಿಪಡಿಸಬೇಕೆ ಎಂದು ನಿರ್ಧರಿಸಬೇಕು.
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi