In the Weights: LLMs ਦੇ ਯੁੱਗ ਵਿੱਚ ਆਪਣੀ ਡਿਜੀਟਲ ਵਿਰਾਸਤ ਨੂੰ ਮਾਪਣਾ
ਜਿਵੇਂ-ਜਿਵੇਂ ਵੈੱਬ ਸਰਚ ਇੰਜਣ ਸੱਚ ਦੇ ਮੁੱਖ ਸਰੋਤ ਵਜੋਂ ਆਪਣਾ ਦਰਜਾ ਗੁਆ ਰਹੇ ਹਨ, ਇੱਕ ਨਵੀਂ ਡਿਜੀਟਲ ਸਰਹੱਦ ਉਭਰ ਰਹੀ ਹੈ: Large Language Models ਦੇ ਅੰਦਰੂਨੀ ਪੈਰਾਮੀਟਰ। "In the Weights," ਇੱਕ ਨਵਾਂ ਵੈਨਿਟੀ ਸਰਚ ਟੂਲ, ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਹ ਖੋਜਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ ਕਿ ਕੀ ਉਨ੍ਹਾਂ ਦਾ ਵਜੂਦ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਵਿੱਚ ਉੱਕਰਿਆ ਗਿਆ ਹੈ।
Google ਤੋਂ ਪਰੇ: LLM-ਅਧਾਰਤ ਪਛਾਣ ਦਾ ਉਭਾਰ
ਦਹਾਕਿਆਂ ਤੋਂ, ਆਪਣੀ ਡਿਜੀਟਲ ਫੁੱਟਪ੍ਰਿੰਟ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ "ਆਪਣੇ ਆਪ ਨੂੰ Google ਕਰਨਾ" ਇੱਕ ਮਿਆਰ ਸੀ। ਹਾਲਾਂਕਿ, ਜਿਵੇਂ-ਜਿਵੇਂ ਵਧੇਰੇ ਉਪਭੋਗਤਾ ਰਵਾਇਤੀ ਸਰਚ ਇੰਜਣਾਂ ਤੋਂ ਕਨਵਰਸੇਸ਼ਨਲ AI ਵੱਲ ਵਧ ਰਹੇ ਹਨ, ਆਨਲਾਈਨ ਮੌਜੂਦਗੀ ਦੀ ਧਾਰਨਾ ਬਦਲ ਰਹੀ ਹੈ। Global Illumination ਦੇ ਅਧਿਗ੍ਰਹਿਣ ਰਾਹੀਂ OpenAI ਦੇ ਸਾਬਕਾ ਮੈਂਬਰਾਂ, Thomas Dimson ਅਤੇ Joey Flynn ਨੇ ਇਸ ਤਬਦੀਲੀ ਨੂੰ ਸੰਬੋਧਿਤ ਕਰਨ ਲਈ "In the Weights" ਲਾਂਚ ਕੀਤਾ ਹੈ।
ਇਹ ਪਲੇਟਫਾਰਮ ਇੰਡੈਕਸ ਕੀਤੇ ਵੈੱਬ ਪੇਜਾਂ ਤੋਂ ਦੂਰ ਹੁੰਦਾ ਹੈ ਅਤੇ ਇਸਦੀ ਬਜਾਏ "weights"—ਉਹ ਨੰਬਰਾਈਜ਼ਡ ਪੈਰਾਮੀਟਰ ਜੋ ਇੱਕ AI ਮਾਡਲ ਦੀ ਬੁੱਧੀ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਨ—'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦਾ ਹੈ। ਇਸਦਾ ਉਦੇਸ਼ ਇਹ ਮਾਪਣਾ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਰੀਅਲ-ਟਾਈਮ ਵੈੱਬ ਸਰਚ ਟੂਲ ਦੀ ਮਦਦ ਤੋਂ ਬਿਨਾਂ ਕਿਸੇ ਵਿਸ਼ੇਸ਼ ਵਿਅਕਤੀ ਨੂੰ ਕਿੰਨੀ ਚੰਗੀ ਤਰ੍ਹਾਂ ਯਾਦ ਰੱਖ ਸਕਦਾ ਹੈ, ਜੋ ਅਸਲ ਵਿੱਚ ਇਹ ਜਾਂਚ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਕਿਸੇ ਵਿਅਕਤੀ ਦਾ ਡੇਟਾ ਮਾਡਲ ਦੇ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਸ਼ਾਮਲ ਹੈ।
ਸਕੋਰਿੰਗ ਮਕੈਨਿਜ਼ਮ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ
ਇਹ ਟੂਲ OpenAI ਦੀ GPT ਸੀਰੀਜ਼, Google ਦੇ Gemini, Anthropic ਦੇ Claude, Meta ਦੇ Llama, ਅਤੇ xAI ਦੇ Grok ਸਮੇਤ ਕਈ ਪ੍ਰਮੁੱਖ LLMs ਨੂੰ ਕੁਐਰੀ (query) ਕਰਕੇ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰੋਂਪਟ ਦੀ ਬਣਤਰ ਸਪਸ਼ਟ ਹੈ: ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਪੁੱਛਦਾ ਹੈ, “Who is [name]? Give up to 10 results, each with a short description and confidence.”
ਇੱਕ ਵਾਰ ਡੇਟਾ ਇਕੱਠਾ ਹੋ ਜਾਣ ਤੋਂ ਬਾਅਦ, ਪਲੇਟਫਾਰਮ ਤਿੰਨ ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਕਦਮ ਚੁੱਕਦਾ ਹੈ:
- Clustering: ਇਹ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਤੋਂ ਸਮਾਨ ਵੇਰਵਿਆਂ ਨੂੰ ਇਕੱਠਾ ਕਰਕੇ ਗਰੁੱਪ ਬਣਾਉਂਦਾ ਹੈ।
- Strength Scoring: ਇਹ ਯਾਦ ਰੱਖਣ ਦੀ ਇਕਸਾਰਤਾ ਅਤੇ ਸਪਸ਼ਟਤਾ ਦੇ ਅਧਾਰ 'ਤੇ ਇੱਕ ਨੰਬਰਾਈਜ਼ਡ ਸਕੋਰ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ।
- Hallucination Detection: ਇਹ ਅੰਤਰਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਜਦੋਂ GPT-4o Mini ਵਰਗਾ ਮਾਡਲ ਅਸਪਸ਼ਟ ਜਾਂ ਗਲਤ ਡੇਟਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
ਲੀਡਰਬੋਰਡ weights ਵਿੱਚ ਉਪਲਬਧ ਜਾਣਕਾਰੀ ਦੀ ਘਣਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਹਾਲਾਂਕਿ Macaulay Culkin (988 ਦਾ ਸਕੋਰ) ਅਤੇ Luciano Pavarotti ਵਰਗੇ ਸੈਲੀਬ੍ਰਿਟੀ ਉੱਪਰਲੇ ਸਥਾਨਾਂ 'ਤੇ ਹਨ, ਇਹ ਟੂਲ ਤਕਨੀਕੀ ਪੇਸ਼ੇਵਰਾਂ ਵਰਗੇ ਆਮ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਇੱਕ ਤੁਲਨਾਤਮਕ ਪੈਮਾਨਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਉਹ ਦੇਖ ਸਕਣ ਕਿ ਉਹ "AI brain" ਵਿੱਚ ਕਿੱਥੇ ਹਨ।
ਇਹ AI ਲੈਂਡਸਕੇਪ ਲਈ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ
"In the Weights" ਸਿਰਫ਼ ਇੱਕ ਵਾਇਰਲ ਉਤਸੁਕਤਾ ਤੋਂ ਵੱਧ ਕੁਝ ਨਹੀਂ ਹੈ; ਇਹ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਦੇ ਸਮਾਜਿਕ ਪ੍ਰਭਾਵ ਨੂੰ ਸਮਝਣ ਲਈ ਇੱਕ ਖਿੜਕੀ ਹੈ। ਇਹ ਪ੍ਰੋਜੈਕਟ ਇਸ ਗੱਲ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਮਨੁੱਖੀ ਜੀਵਨਾਂ ਨੂੰ ਅਸਲ ਵਿੱਚ floating-point numbers ਵਿੱਚ ਕੋਡਿਫਾਈ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਨਤੀਜਿਆਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਕੇ, ਨਿਰਮਾਤਾ ਡੂੰਘੇ ਤਕਨੀਕੀ ਅਤੇ ਨੈਤਿਕ ਸਵਾਲਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਦਾ ਇਰਾਦਾ ਰੱਖਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਕਿਹੜੇ ਮਾਡਲ ਖਾਸ ਪੱਖਪਾਤ ਦਿਖਾਉਂਦੇ ਹਨ ਅਤੇ ਕਿਹੜੇ ਵਿਅਕਤੀਆਂ ਦਾ ਸੱਭਿਆਚਾਰਕ ਪ੍ਰਭਾਵ ਮਹੱਤਵਪੂਰਨ ਹੈ ਪਰ Wikipedia ਵਿੱਚ ਕੋਈ ਐਂਟਰੀ ਨਹੀਂ ਹੈ।
ਜਿਵੇਂ-ਜਿਵੇਂ LLMs ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁੱਖ ਇੰਟਰਫੇਸ ਬਣ ਰਹੇ ਹਨ, ਇਹ ਸਮਝਣਾ ਕਿ ਉਹਨਾਂ ਦੇ weights ਵਿੱਚ ਕੀ ਸ਼ਾਮਲ ਹੈ—ਅਤੇ ਕੀ ਨਹੀਂ—ਖੋਜਕਰਤਾਵਾਂ, content creators, ਅਤੇ ਇੱਕ post-search ਦੁਨੀਆ ਵਿੱਚ ਆਪਣੀ ਲੰਬੇ ਸਮੇਂ ਦੀ ਡਿਜੀਟਲ ਵਿਰਾਸਤ ਬਾਰੇ ਚਿੰਤਤ ਵਿਅਕਤੀਆਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇਗਾ।
ਮੁੱਖ ਗੱਲਾਂ
- ਡਿਜੀਟਲ ਪਛਾਣ ਵਿੱਚ ਬਦਲਾਅ: ਜਿਵੇਂ ਕਿ ਟ੍ਰੈਫਿਕ ਸਰਚ ਇੰਜਣਾਂ ਤੋਂ LLMs ਵੱਲ ਜਾ ਰਿਹਾ ਹੈ, "vanity searches" ਵੈੱਬ ਇੰਡੈਕਸਿੰਗ ਤੋਂ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਵੱਲ ਤਬਦੀਲ ਹੋ ਰਹੀਆਂ ਹਨ।
- Cross-Model Benchmarking: ਇਹ ਟੂਲ ਵੱਖ-ਵੱਖ architectures (GPT, Claude, Llama, ਆਦਿ) ਦੁਆਰਾ ਖਾਸ ਜਾਣਕਾਰੀ ਨੂੰ ਯਾਦ ਰੱਖਣ ਦੇ ਤਰੀਕੇ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਇੱਕ ਵਿਲੱਖਣ ਤਰੀਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
- Data Encoding: ਇਹ ਪ੍ਰੋਜੈਕਟ ਇਸ ਸੱਚਾਈ 'ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ ਕਿ ਮਨੁੱਖੀ ਜਾਣਕਾਰੀ ਦੀ ਭਾਰੀ ਮਾਤਰਾ ਹੁਣ neural networks ਦੇ ਅੰਦਰ numerical weights ਵਜੋਂ ਸਟੋਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।