𝗧𝗵𝗲 𝗥𝗼𝘀𝗲𝘁𝘁𝗮 𝗣𝗿𝗼𝗺𝗽𝘁

📅3 hours ago⏱2 min read

ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್ (The Rosetta Prompt)

ನೀವು AI ಗೆ ಇಂಗ್ಲಿಷ್‌ನಲ್ಲಿ ಒಂದು ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಟೈಪ್ ಮಾಡುತ್ತೀರಿ: "ಒಬ್ಬ ಯಶಸ್ವಿ ವ್ಯವಹಾರ ನಾಯಕನನ್ನು ವಿವರಿಸಿ."

AI ಸೂಟ್ ಧರಿಸಿದ ಆತ್ಮವಿಶ್ವಾಸವುಳ್ಳ ವ್ಯಕ್ತಿಯನ್ನು ವಿವರಿಸುತ್ತದೆ.

ನೀವು ಅದೇ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಜಪಾನೀಸ್ ಭಾಷೆಗೆ ಅನುವಾದಿಸುತ್ತೀರಿ. ಆಗ ಔಟ್‌ಪುಟ್ ಬದಲಾಗುತ್ತದೆ. ಆ ನಾಯಕನು ವಿನಮ್ರನಾಗಿ ಮತ್ತು ಗುಂಪಿನ ಸಾಮರಸ್ಯದ ಮೇಲೆ ಗಮನ ಹರಿಸುವವನಾಗಿ ಬದಲಾಗುತ್ತಾನೆ.

ಮಾಡೆಲ್ ಒಂದೇ ಆಗಿದೆ. ತೂಕಗಳು (weights) ಒಂದೇ ಆಗಿವೆ. ಆದರೆ ಭಾಷೆಯು ಸಾಂಸ್ಕೃತಿಕ ದೃಷ್ಟಿಕೋನವನ್ನು ಬದಲಾಯಿಸಿದೆ.

ಇದನ್ನೇ ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್ (Rosetta Prompt) ಎನ್ನಲಾಗುತ್ತದೆ. ತರಬೇತಿ ದತ್ತಾಂಶದಲ್ಲಿರುವ (training data) ಸಾಂಸ್ಕೃತಿಕ ಕಲ್ಪನೆಗಳನ್ನು ಗುರುತಿಸಲು ನೀವು ವಿವಿಧ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೇ ಪ್ರಶ್ನೆಯನ್ನು ಬಳಸುತ್ತೀರಿ.

AI ತಟಸ್ಥವಾಗಿದೆ ಎಂದು ನಾವು ಭಾವಿಸುತ್ತೇವೆ. ಆದರೆ ಅದು ತಟಸ್ಥವಲ್ಲ. ಅದು ತನ್ನ ದತ್ತಾಂಶದ ಪ್ರತಿಬಿಂಬವಾಗಿದೆ. ಹೆಚ್ಚಿನ ತರಬೇತಿ ದತ್ತಾಂಶವು ಇಂಗ್ಲಿಷ್, ಪಾಶ್ಚಾತ್ಯ ಮತ್ತು ಕಾರ್ಪೊರೇಟ್ ಶೈಲಿಯದ್ದಾಗಿದೆ.

ಸಾರ್ವತ್ರಿಕ ಮಾಡೆಲ್ ಎಂಬ ಭ್ರಮೆ

ಇಂಗ್ಲಿಷ್ ಪಕ್ಷಪಾತವು ವಾಸ್ತವವಾಗಿದೆ. ಸುಮಾರು 80% ತರಬೇತಿ ದತ್ತಾಂಶವು ಇಂಗ್ಲಿಷ್‌ನಲ್ಲಿದೆ. ಇಂಗ್ಲಿಷ್ ಬಳಕೆದಾರರು ಸೂಕ್ಷ್ಮ ಮತ್ತು ಸಾಂಸ್ಕೃತಿಕವಾಗಿ ಹೊಂದಾಣಿಕೆಯಾದ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ. ಇಂಗ್ಲಿಷ್ ಅಲ್ಲದ ಬಳಕೆದಾರರು ಹೆಚ್ಚಾಗಿ ಪಾಶ್ಚಾತ್ಯ ದೃಷ್ಟಿಕೋನದಿಂದ ಅನುವಾದಿತವಾದ ಉತ್ತರಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ.

ವಿವಿಧ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೇ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಬಳಸಿದಾಗ ವಿಭಿನ್ನ AI ವ್ಯಕ್ತಿತ್ವಗಳು ಸೃಷ್ಟಿಯಾಗುತ್ತವೆ.

ಇಂಗ್ಲಿಷ್ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ನೇರ ಮತ್ತು ವೈಯಕ್ತಿಕವಾದ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತವೆ.
ಜಪಾನೀಸ್ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ವಿನಮ್ರ ಮತ್ತು ಸಾಮೂಹಿಕವಾದ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತವೆ.

ಪ್ರಯೋಗ: ನಾಲ್ಕು ಭಾಷೆಗಳು, ಒಂದು ಪ್ರಾಂಪ್ಟ್

ಪ್ರಾಂಪ್ಟ್: "ಒಬ್ಬ ಜ್ಞಾನಿ ವ್ಯಕ್ತಿ"

• ಇಂಗ್ಲಿಷ್: ಗ್ರಂಥಾಲಯದಲ್ಲಿ ನಿಗೂಢ ಸಲಹೆ ನೀಡುತ್ತಿರುವ ವಯಸ್ಸಾದ ವ್ಯಕ್ತಿ. • ಸ್ಪ್ಯಾನಿಷ್: ಅನೇಕ ಅನುಭವಗಳಿಂದ ಕಲಿಯುವ ವ್ಯಕ್ತಿ. • ಜಪಾನೀಸ್: ಇತರರ ಮಾತುಗಳನ್ನು ಆಲಿಸುವ ಮತ್ತು ಸಾಮರಸ್ಯಕ್ಕೆ ಮೌಲ್ಯ ನೀಡುವ ವ್ಯಕ್ತಿ. • ಅರೇಬಿಕ್: ಹೃದಯದಲ್ಲಿ ದೇವರನ್ನು ಇಟ್ಟುಕೊಂಡು ನ್ಯಾಯಯುತವಾಗಿ ವರ್ತಿಸುವ ವ್ಯಕ್ತಿ.

AI ತಪ್ಪಾಗಿಲ್ಲ. ಅದು ಸಾಂಸ್ಕೃತಿಕ ಸತ್ಯಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತಿದೆ. ಅರೇಬಿಕ್‌ನಲ್ಲಿ ಜ್ಞಾನವು ನ್ಯಾಯವನ್ನು ಒಳಗೊಂಡಿದೆ. ಜಪಾನೀಸ್‌ನಲ್ಲಿ ಜ್ಞಾನವು ಸಾಮರಸ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ.

ಇದು ಏಕೆ ಸಂಭವಿಸುತ್ತದೆ

ಟೋಕನೈಸೇಶನ್ (Tokenization): ವಿವಿಧ ಭಾಷೆಗಳು ಮಾಡೆಲ್‌ಗೆ ವಿಭಿನ್ನವಾಗಿ ಕಾಣಿಸುತ್ತವೆ.
ತರಬೇತಿ ವಿತರಣೆ (Training Distribution): ಇಂಗ್ಲಿಷ್ ದತ್ತಾಂಶವು ಹೇರಳವಾಗಿದೆ. ಇತರ ಭಾಷೆಗಳು ಕಡಿಮೆ ಇವೆ.
ಸಾಂಸ್ಕೃತಿಕ ಎಂಬೆಡ್ಡಿಂಗ್ (Cultural Embedding): ಜ್ಞಾನದಂತಹ ಪರಿಕಲ್ಪನೆಗಳು ನಿರ್ದಿಷ್ಟ ಸಾಂಸ್ಕೃತಿಕ ಕಥೆಗಳಿಗೆ ಸಂಬಂಧಿಸಿವೆ.

ರೋಸೆಟ್ಟಾ ಪ್ರಾಂಪ್ಟ್‌ನ ನೈತಿಕತೆ

ಭಾಷೆಯ ಆಧಾರದ ಮೇಲೆ ಬಳಕೆದಾರರನ್ನು ವಿಭಿನ್ನವಾಗಿ ನಡೆಸಿಕೊಳ್ಳುವ ಚಾಟ್‌ಬಾಟ್ ತಟಸ್ಥವಲ್ಲ ಎಂಬುದು ಜಾಗತಿಕ ಉತ್ಪನ್ನಗಳಿಗೆ ತಿಳಿದಿರಬೇಕು. AI ಅನುವಾದಕನನ್ನು ಬಳಸುವ ರಾಜತಾಂತ್ರಿಕರಿಗೆ, AI ಪಠ್ಯಕ್ಕೆ ಸಾಂಸ್ಕೃತಿಕ ಪದರಗಳನ್ನು ಸೇರಿಸುತ್ತಿದೆ ಎಂಬುದು ತಿಳಿಯದಿರಬಹುದು.

ನೀವು AI ಅನ್ನು ಕೇವಲ ಇಂಗ್ಲಿಷ್‌ನಲ್ಲಿ ಮಾತ್ರ ಪರೀಕ್ಷಿಸಿದರೆ, ಶತಕೋಟಿ ಜನರ ವಾಸ್ತವವನ್ನು ನೀವು ಕಳೆದುಕೊಳ್ಳುತ್ತೀರಿ.

ನಿಮ್ಮದೇ ಆದ ಪ್ರಯೋಗವನ್ನು ಮಾಡುವುದು ಹೇಗೆ

ಒಂದು ಪರಿಕಲ್ಪನೆಯನ್ನು ಆರಿಸಿ: "leader," "success," ಅಥವಾ "family" ಎಂಬ ಪದಗಳನ್ನು ಬಳಸಿ.
ಅದನ್ನು ಅನುವಾದಿಸಿ: 3 ರಿಂದ 4 ವಿಭಿನ್ನ ಭಾಷೆಗಳನ್ನು ಬಳಸಿ.
ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಚಲಾಯಿಸಿ: ಪ್ರತಿಯೊಂದು ಭಾಷೆಗೂ ಒಂದೇ ರೀತಿಯ AI ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸಿ.
ಹೋಲಿಸಿ: ವೈಯಕ್ತಿಕವಾದ ಮತ್ತು ಸಾಮೂಹಿಕತೆಯಂತಹ ಮಾದರಿಗಳನ್ನು ಗಮನಿಸಿ.

AI ಅಂತಿಮ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಅದಕ್ಕೆ ಕೇವಲ ಅಂಕಿಅಂಶಗಳು ಮಾತ್ರ ತಿಳಿದಿವೆ. ನಾವು ಈ ಪೂರ್ವಾಗ್ರಹವನ್ನು ಒಪ್ಪಿಕೊಳ್ಳಬೇಕೆ ಅಥವಾ ಅದನ್ನು ಸರಿಪಡಿಸಬೇಕೆ ಎಂದು ನಿರ್ಧರಿಸಬೇಕು.

ಮೂಲ: https://dev.to/velocityai/the-rosetta-prompt-using-multilingual-prompts-to-map-alignment-across-language-versions-of-the-5gme

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗥𝗼𝘀𝗲𝘁𝘁𝗮 𝗣𝗿𝗼𝗺𝗽𝘁

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

ಎಐ ಎಂದರೆ ಕೇವಲ ಪ್ರಾಂಪ್ಟ್‌ಗಳಲ್ಲ

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗜𝘀𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴. 𝗜𝘁'𝘀 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴.