In the Weights: New Tool Reveals Your Digital Presence in AI Models

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 ವಾರಗಳ ಹಿಂದೆ3min read

In this article

In the Weights: AI ಮಾದರಿಗಳಲ್ಲಿ ನಿಮ್ಮ ಡಿಜಿಟಲ್ ಉಪಸ್ಥಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುವ ಹೊಸ ಸಾಧನ

ವಿಶ್ವದ ಅತ್ಯಂತ ಶಕ್ತಿಯುತ AI ನ ನರಮಂಡಲಗಳಲ್ಲಿ (neural networks) ನಿಮ್ಮ ವೈಯಕ್ತಿಕ ಗುರುತು ಕೆತ್ತಲ್ಪಟ್ಟಿದೆಯೇ ಎಂದು ನೀವು ಎಂದಾದರೂ ಯೋಚಿಸಿದ್ದೀರಾ? "In the Weights" ಎಂಬ ಹೊಸ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಈಗ ನಿರ್ದಿಷ್ಟ ವ್ಯಕ್ತಿಗಳು Large Language Models (LLMs) ನಲ್ಲಿ ಎಷ್ಟು ಆಳವಾಗಿ ಅಡಕವಾಗಿದ್ದಾರೆ ಎಂಬುದನ್ನು ಅಳೆಯುವ ಮೂಲಕ ಆ ಪ್ರಶ್ನೆಗೆ ಪರಿಮಾಣಾತ್ಮಕ ಉತ್ತರವನ್ನು ನೀಡುತ್ತಿದೆ.

ಜ್ಞಾನದ "Weights" ಅನ್ನು ಡಿಕೋಡ್ ಮಾಡುವುದು

Large Language Models ಸಾಂಪ್ರದಾಯಿಕ ಡೇಟಾಬೇಸ್‌ಗಳಂತೆ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ; ಅವು "weights" ಎಂದು ಕರೆಯಲ್ಪಡುವ ಶತಕೋಟಿ ಸಂಖ್ಯಾತ್ಮಕ ಮೌಲ್ಯಗಳ ಮೂಲಕ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುತ್ತವೆ. ಈ weights ಮಾದರಿಯು ತನ್ನ ಬೃಹತ್ ತರಬೇತಿ ಹಂತದ ಸಮಯದಲ್ಲಿ ಕಲಿತ ಮಾದರಿಗಳು ಮತ್ತು ಸತ್ಯಗಳನ್ನು ಎನ್‌ಕೋಡ್ ಮಾಡುತ್ತವೆ. ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಈ weights ನಲ್ಲಿ ಕಾಣಿಸಿಕೊಂಡರೆ, ಅದರರ್ಥ ಆ ವ್ಯಕ್ತಿಯ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ನೆನಪಿಸಿಕೊಳ್ಳಲು ರಿಯಲ್-ಟೈಮ್ ವೆಬ್ ಸರ್ಚ್ ಅಥವಾ RAG (Retrieval-Augmented Generation) ಪರಿಕರಗಳನ್ನು ಬಳಸುವ ಅಗತ್ಯವಿಲ್ಲದೆ, ಮಾದರಿಯು ಅವರನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನೆನಪಿಸಿಕೊಳ್ಳುವಷ್ಟು ಪ್ರಸ್ತುತವೆಂದು ಪರಿಗಣಿಸುತ್ತದೆ ಎಂದರ್ಥ.

ಮಾಜಿ OpenAI ಉದ್ಯೋಗಿಗಳಾದ Joey Flynn ಮತ್ತು Thomas Dimson ಅವರು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ "In the Weights", ಒಂದು ನಿರ್ದಿಷ್ಟ ಹೆಸರು ಸುಸಂಬದ್ಧ ಜೀವನಚರಿತ್ರೆಯ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಪ್ರಚೋದಿಸುತ್ತದೆಯೇ ಎಂದು ಪತ್ತೆಹಚ್ಚಲು ವಿವಿಧ ಮಾದರಿಗಳನ್ನು ವ್ಯವಸ್ಥಿತವಾಗಿ ಪ್ರಶ್ನಿಸುತ್ತದೆ. ನಂತರ ಈ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಈ ಸಂಶೋಧನೆಗಳನ್ನು ಕ್ರೋಢೀಕರಿಸಿ ವ್ಯಕ್ತಿಗೆ "strength score" ಅನ್ನು ನೀಡುತ್ತದೆ, ಇದು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ (AI) ಲ್ಯಾಟೆಂಟ್ ಸ್ಪೇಸ್‌ನಲ್ಲಿ (latent space) ಅವರ ಪ್ರಸಿದ್ಧಿಯ ಮಟ್ಟವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಕ್ಷೆ ಮಾಡುತ್ತದೆ.

Strength Scores ಮೂಲಕ ಪ್ರಸಿದ್ಧಿಯನ್ನು ಅಳೆಯುವುದು

ಸಾಧಾರಣ ಉಲ್ಲೇಖ ಮತ್ತು ತರಬೇತಿಯ ಪ್ರಮುಖ ಮಾಹಿತಿಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸಲು ಈ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಅತ್ಯಾಧುನಿಕ ಸ್ಕೋರಿಂಗ್ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತದೆ. ಸಂದರ್ಭವನ್ನು ಒದಗಿಸಲು, ರಚನೆಕಾರರು ಪ್ರಸ್ತುತತೆಯ ವ್ಯಾಪ್ತಿಯನ್ನು (spectrum of relevance) ಸ್ಥಾಪಿಸಿದ್ದಾರೆ:

ಕಡಿಮೆ ಮಟ್ಟದ ಉಪಸ್ಥಿತಿ: ಹೆಚ್ಚಿನ ಖಾಸಗಿ ವ್ಯಕ್ತಿಗಳು ಕಡಿಮೆ ಸ್ಕೋರ್‌ಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ.
ಹೆಚ್ಚಿನ ಮಟ್ಟದ ಉಪಸ್ಥಿತಿ: Meta ನ 1 ಬಿಲಿಯನ್ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಹೊಂದಿರುವ Llama ನಂತಹ ಸಣ್ಣ ಮಾದರಿಗಳಲ್ಲಿ ಕಾಣಿಸಿಕೊಂಡರೂ ಸಹ, ಅದು ಹೆಚ್ಚಿನ ಪ್ರಸ್ತುತತೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ.
ಗರಿಷ್ಠ ಪ್ರಸ್ತುತತೆ: Mozart, William Shakespeare ಅಥವಾ Taylor Swift ನಂತಹ ಜಾಗತಿಕ ಐಕಾನ್‌ಗಳಿಗಾಗಿ 996 ರ ಗರಿಷ್ಠ strength score ಅನ್ನು ಮೀಸಲಿಡಲಾಗಿದೆ.

ಹಲವಾರು ಮಾದರಿಗಳನ್ನು ಪರೀಕ್ಷಿಸುವ ಮೂಲಕ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಮೂಲಕ, ಈ ಸಾಧನವು ಕೇವಲ "ಹೌದು ಅಥವಾ ಇಲ್ಲ" ಎಂಬ ಉತ್ತರಗಳಿಗಿಂತ ಮೀರಿದ ಮಾಪಕವನ್ನು ಒದಗಿಸುತ್ತದೆ, ಇದು AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಎಷ್ಟು "weight" ಹೊಂದಿದ್ದಾರೆ ಎಂಬುದರ ಬಗ್ಗೆ ಸೂಕ್ಷ್ಮ ನೋಟವನ್ನು ನೀಡುತ್ತದೆ.

ಮಿತಿಗಳು ಮತ್ತು Hallucination ನ ಸವಾಲು

ಈ ಸಾಧನವು AI ನೆನಪಿನ ಶಕ್ತಿಯ ಬಗ್ಗೆ ಆಕರ್ಷಕ ನೋಟವನ್ನು ನೀಡಿದರೂ, ಅದರ ತಯಾರಕರು LLMಗಳ ಅಂತರ್ಗತ ತಾಂತ್ರಿಕ ಅಡೆತಡೆಗಳನ್ನು ಎತ್ತಿ ತೋರಿಸುತ್ತಾರೆ. ಪ್ರಮುಖ ಅಪಾಯಗಳಲ್ಲಿ ಒಂದೆಂದರೆ ಭ್ರಮೆ ಅಥವಾ ಹ್ಯಾಲ್ಯುಸಿನೇಶನ್ (hallucination), ಅಂದರೆ ಒಂದು ಮಾದರಿಯು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದ ವ್ಯಕ್ತಿಯ ಬಗ್ಗೆ ಜೀವನ ಚರಿತ್ರೆಯ ವಿವರಗಳನ್ನು ಆತ್ಮವಿಶ್ವಾಸದಿಂದ ಸೃಷ್ಟಿಸಬಹುದು ಅಥವಾ ಸತ್ಯಾಂಶಗಳನ್ನು ತಪ್ಪಾಗಿ ನೀಡಬಹುದು.

ಅಲ್ಲದೆ, ಸ್ಟ್ರೆಂತ್ ಸ್ಕೋರ್‌ನ (strength score) ನಿಖರತೆಯು ಇನ್‌ಪುಟ್ ಗುಣಮಟ್ಟದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ; ಸಣ್ಣ ಕಾಗುಣಿತ ದೋಷಗಳು (typos) ಸ್ಕೋರ್ ಅನ್ನು ಗಣನೀಯವಾಗಿ ಕಡಿಮೆ ಮಾಡಬಹುದು ಮತ್ತು ಸಾಮಾನ್ಯ ಹೆಸರುಗಳು ಗೊಂದಲಮಯ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡಬಹುದು, ಏಕೆಂದರೆ ಒಂದೇ ಹೆಸರಿನ ವಿವಿಧ ವ್ಯಕ್ತಿಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸಲು ಮಾದರಿಯು ಕಷ್ಟಪಡುತ್ತದೆ. ಇದು ವಸ್ತುನಿಷ್ಠ ಜೀವನ ಚರಿತ್ರೆಯ ಸತ್ಯಾಂಶಗಳನ್ನು ಅಳೆಯಲು ಸಂಭವನೀಯ ಮಾದರಿಗಳನ್ನು (probabilistic models) ಬಳಸುವ ಸಂಕೀರ್ಣತೆಯನ್ನು ಎತ್ತಿ ತೋರಿಸುತ್ತದೆ.

ಇದು AI ಪರಿಸರಕ್ಕೆ ಏಕೆ ಮುಖ್ಯ

AI ಮಾದರಿಗಳು ಮಾಹಿತಿ ಪಡೆಯಲು ಪ್ರಮುಖ ಮಾಧ್ಯಮಗಳಾಗುತ್ತಿರುವಂತೆ, ಅವುಗಳು mặc định (default) ಆಗಿ ಏನನ್ನು "ತಿಳಿದಿವೆ" ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ನಿರ್ಣಾಯಕವಾಗಿದೆ. ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಸಂಶೋಧಕರಿಗೆ, "In the Weights" ಎಂಬುದು ಮಾದರಿಯ ಪ್ರಮಾಣ (scale) ಮತ್ತು ದತ್ತಾಂಶದ ಸಾಂದ್ರತೆಯ (data density) ನಡುವಿನ ಸಂಘರ್ಷವನ್ನು ಎತ್ತಿ ತೋರಿಸುತ್ತದೆ. ನಮ್ಮ ಡಿಜಿಟಲ್ ಗುರುತುಗಳು ಮಾಲೀಕತ್ವದ ಮಾದರಿಗಳ (proprietary models) ಶಾಶ್ವತ ಸಂಖ್ಯಾತ್ಮಕ ತೂಕಗಳಲ್ಲಿ (numerical weights) ಅಡಕವಾಗುತ್ತಿರುವ ಈ ಯುಗದಲ್ಲಿ, ಇದು ಗೌಪ್ಯತೆ ಮತ್ತು "ಮರೆತುಹೋಗುವ ಹಕ್ಕು" (right to be forgotten) ಕುರಿತು ಪ್ರಮುಖ ಪ್ರಶ್ನೆಗಳನ್ನು ಎತ್ತುತ್ತದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

AI ನೆನಪನ್ನು ಅಳೆಯುವುದು (Quantifying AI Memory): ಒಬ್ಬ ವ್ಯಕ್ತಿಯ ಗುರುತನ್ನು ಮಾದರಿಯ ತೂಕಗಳಲ್ಲಿ (weights) ಎಷ್ಟು ಆಳವಾಗಿ ಎನ್‌ಕೋಡ್ ಮಾಡಲಾಗಿದೆ ಎಂಬುದನ್ನು ಅಳೆಯಲು "In the Weights" ಒಂದು ಸ್ಟ್ರೆಂತ್ ಸ್ಕೋರ್ ಅನ್ನು (996 ವರೆಗೆ) ಬಳಸುತ್ತದೆ.
ಪ್ರಸ್ತುತತೆಯ ಮಾನದಂಡಗಳು (Relevance Benchmarks): Meta ನ Llama ನಂತಹ ಸಣ್ಣ, ಪ್ಯಾರಾಮೀಟರ್-ಸಮರ್ಥ ಮಾದರಿಗಳಲ್ಲಿ ಕಂಡುಬರುವುದು, ಆ ಮಾದರಿಯ ತರಬೇತಿ ದತ್ತಾಂಶಕ್ಕೆ (training data) ಹೆಚ್ಚಿನ ಪ್ರಸ್ತುತತೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ.
ತಾಂತ್ರಿಕ ಮಿತಿಗಳು (Technical Constraints): ಈ ಸಾಧನವು ಭ್ರಮೆಗಳು (hallucinations), ಹೆಸರಿನ ಅಸ್ಪಷ್ಟತೆ ಮತ್ತು ಕಾಗುಣಿತ ದೋಷಗಳ ಬಗ್ಗೆ ಸೂಕ್ಷ್ಮತೆಯಂತಹ ಸಾಮಾನ್ಯ LLM ಸಮಸ್ಯೆಗಳನ್ನು ಎದುರಿಸಬೇಕಾಗುತ್ತದೆ.

In the Weights: New Tool Reveals Your Digital Presence in AI Models

In the Weights: AI ಮಾದರಿಗಳಲ್ಲಿ ನಿಮ್ಮ ಡಿಜಿಟಲ್ ಉಪಸ್ಥಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುವ ಹೊಸ ಸಾಧನ

ಜ್ಞಾನದ "Weights" ಅನ್ನು ಡಿಕೋಡ್ ಮಾಡುವುದು

Strength Scores ಮೂಲಕ ಪ್ರಸಿದ್ಧಿಯನ್ನು ಅಳೆಯುವುದು

ಮಿತಿಗಳು ಮತ್ತು Hallucination ನ ಸವಾಲು

ಇದು AI ಪರಿಸರಕ್ಕೆ ಏಕೆ ಮುಖ್ಯ

ಪ್ರಮುಖ ಅಂಶಗಳು

Continue reading

ಮೆಟಾ‌ನ ಎಐ ಮೋಡ್: ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಡೇಟಾವನ್ನು ಹುಡುಕಾಟಕ್ಕೆ ಆಧಾರವಾಗಿ ಬಳಸುವುದರಿಂದ ಉಂಟಾಗುವ ಅಪಾಯಗಳು

ಹೊಸ AA ಬ್ರೀಫ್‌ಕೇಸ್ ಬೆಂಚ್‌ಮಾರ್ಕ್ ನೈಜ ಜ್ಞಾನದ ಕೆಲಸದಲ್ಲಿ AI ಎದುರಿಸುತ್ತಿರುವ ಸವಾಲನ್ನು ಬಹಿರಂಗಪಡಿಸಿದೆ

ತೂಕಗಳಲ್ಲಿ: ಎಲ್ಎಲ್‌ಎಂಗಳ ಯುಗದಲ್ಲಿ ನಿಮ್ಮ ಡಿಜಿಟಲ್ ಪರಂಪರೆಯನ್ನು ಅಳೆಯುವುದು