In the Weights: ਨਵਾਂ ਟੂਲ AI ਮਾਡਲਾਂ ਵਿੱਚ ਤੁਹਾਡੀ ਡਿਜੀਟਲ ਮੌਜੂਦਗੀ ਨੂੰ ਪ੍ਰਗਟ ਕਰਦਾ ਹੈ

ਕੀ ਤੁਸੀਂ ਕਦੇ ਸੋਚਿਆ ਹੈ ਕਿ ਕੀ ਤੁਹਾਡੀ ਨਿੱਜੀ ਪਛਾਣ ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ AI ਦੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਵਿੱਚ ਉੱਕਰੀ ਹੋਈ ਹੈ? "In the Weights" ਨਾਮ ਦਾ ਇੱਕ ਨਵਾਂ ਪਲੇਟਫਾਰਮ ਹੁਣ ਇਹ ਮਾਪ ਕੇ ਉਸ ਸਵਾਲ ਦਾ ਮਾਤਰਾਤਮਕ ਉੱਤਰ ਦੇ ਰਿਹਾ ਹੈ ਕਿ ਵਿਸ਼ੇਸ਼ ਵਿਅਕਤੀ Large Language Models (LLMs) ਵਿੱਚ ਕਿੰਨੀ ਡੂੰਘਾਈ ਨਾਲ ਸ਼ਾਮਲ ਹਨ।

ਗਿਆਨ ਦੇ "weights" ਨੂੰ ਡੀਕੋਡ ਕਰਨਾ

Large Language Models ਰਵਾਇਤੀ ਡੇਟਾਬੇਸ ਵਾਂਗ ਕੰਮ ਨਹੀਂ ਕਰਦੇ; ਉਹ "weights" ਵਜੋਂ ਜਾਣੇ ਜਾਂਦੇ ਅਰਬਾਂ ਅੰਕੀਤ ਮੁੱਲਾਂ ਰਾਹੀਂ ਜਾਣਕਾਰੀ ਨੂੰ ਸਟੋਰ ਕਰਦੇ ਹਨ। ਇਹ weights ਉਹਨਾਂ ਪੈਟਰਨਾਂ ਅਤੇ ਤੱਥਾਂ ਨੂੰ ਐਨਕੋਡ ਕਰਦੇ ਹਨ ਜੋ ਮਾਡਲ ਨੇ ਆਪਣੇ ਵਿਸ਼ਾਲ ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਦੌਰਾਨ ਸਿੱਖੇ ਸਨ। ਜਦੋਂ ਕੋਈ ਵਿਅਕਤੀ ਇਹਨਾਂ weights ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ, ਤਾਂ ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਾਡਲ ਉਹਨਾਂ ਨੂੰ ਇੰਨਾ ਪ੍ਰਸੰਗਿਕ ਮੰਨਦਾ ਹੈ ਕਿ ਉਹ ਰੀਅਲ-ਟਾਈਮ ਵੈੱਬ ਸਰਚ ਕਰਨ ਜਾਂ RAG (Retrieval-Augmented Generation) ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ, ਆਪਣੇ ਆਪ ਉਹਨਾਂ ਬਾਰੇ ਜਾਣਕਾਰੀ ਯਾਦ ਕਰ ਸਕਦਾ ਹੈ।

OpenAI ਦੇ ਸਾਬਕਾ ਕਰਮਚਾਰੀਆਂ Joey Flynn ਅਤੇ Thomas Dimson ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, "In the Weights" ਵਿਵਸਥਿਤ ਤਰੀਕੇ ਨਾਲ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਤੋਂ ਪੁੱਛਗਿੱਛ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਇਹ ਪਛਾਣਿਆ ਜਾ ਸਕੇ ਕਿ ਕੀ ਕੋਈ ਖਾਸ ਨਾਮ ਇੱਕ ਸੁਸੰਗਤ ਜੀਵਨੀ ਸੰਬੰਧੀ ਪ੍ਰਤੀਕਿਰਿਆ ਨੂੰ ਉਤੇਜਿਤ ਕਰਦਾ ਹੈ। ਫਿਰ ਪਲੇਟਫਾਰਮ ਇੱਕ ਵਿਅਕਤੀ ਨੂੰ "strength score" ਦੇਣ ਲਈ ਇਹਨਾਂ ਖੋਜਾਂ ਨੂੰ ਇਕੱਠਾ ਕਰਦਾ ਹੈ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਲੇਟੈਂਟ ਸਪੇਸ (latent space) ਦੇ ਅੰਦਰ ਉਹਨਾਂ ਦੀ ਪ੍ਰਸਿੱਧੀ ਦੇ ਪੱਧਰ ਨੂੰ ਮੈਪ ਕਰਦਾ ਹੈ।

Strength Scores ਰਾਹੀਂ ਪ੍ਰਸਿੱਧੀ ਨੂੰ ਮਾਪਣਾ

ਪਲੇਟਫਾਰਮ ਇੱਕ ਆਮ ਜ਼ਿਕਰ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਦੇ ਇੱਕ ਮੁੱਖ ਹਿੱਸੇ ਵਿਚਕਾਰ ਅੰਤਰ ਕਰਨ ਲਈ ਇੱਕ ਉੱਨਤ ਸਕੋਰਿੰਗ ਪ੍ਰਣਾਲੀ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਪ੍ਰਸੰਗਿਕਤਾ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ, ਨਿਰਮਾਤਾਵਾਂ ਨੇ ਪ੍ਰਸੰਗਿਕਤਾ ਦਾ ਇੱਕ ਸਪੈਕਟ੍ਰਮ ਸਥਾਪਤ ਕੀਤਾ ਹੈ:

  • ਘੱਟ ਪੱਧਰ ਦੀ ਮੌਜੂਦਗੀ: ਜ਼ਿਆਦਾਤਰ ਨਿੱਜੀ ਵਿਅਕਤੀਆਂ ਦੇ ਸਕੋਰ ਘੱਟ ਹੋਣਗੇ।
  • ਉੱਚ ਪੱਧਰ ਦੀ ਮੌਜੂਦਗੀ: ਇੱਥੋਂ ਤੱਕ ਕਿ 1 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ Meta ਦੇ Llama ਵਰਗੇ ਛੋਟੇ ਮਾਡਲਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦੇਣਾ ਵੀ ਉੱਚ ਪ੍ਰਸੰਗਿਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
  • ਵੱਧ ਤੋਂ ਵੱਧ ਪ੍ਰਸੰਗਿਕਤਾ: 996 ਦਾ ਵੱਧ ਤੋਂ ਵੱਧ strength score Mozart, William Shakespeare, ਜਾਂ Taylor Swift ਵਰਗੇ ਗਲੋਬਲ ਆਈਕਨਾਂ ਲਈ ਰਾਖਵਾਂ ਹੈ।

ਕਈ ਮਾਡਲਾਂ ਦੀ ਜਾਂਚ ਕਰਕੇ ਅਤੇ ਨਤੀਜਿਆਂ ਨੂੰ ਜੋੜ ਕੇ, ਇਹ ਟੂਲ ਇੱਕ ਅਜਿਹਾ ਮਾਪਦੰਡ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਜੋ ਸਧਾਰਨ "ਹਾਂ ਜਾਂ ਨਾ" ਦੇ ਉੱਤਰਾਂ ਤੋਂ ਅੱਗੇ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਇਹ ਇੱਕ ਬਾਰੀਕ ਨਜ਼ਰੀਆ ਦਿੰਦਾ ਹੈ ਕਿ ਇੱਕ ਵਿਅਕਤੀ AI ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਕਿੰਨਾ "weight" ਰੱਖਦਾ ਹੈ।

ਸੀਮਾਵਾਂ ਅਤੇ Hallucination ਦੀ ਚੁਣੌਤੀ

ਜਦੋਂ ਕਿ ਇਹ ਟੂਲ AI ਮੈਮੋਰੀ ਦੀ ਇੱਕ ਦਿਲਚਸਪ ਝਲਕ ਪੇਸ਼ ਕਰਦਾ ਹੈ, ਨਿਰਮਾਤਾ LLMs ਦੀਆਂ ਮੌਜੂਦਾ ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਨ ਵਿੱਚ ਤੇਜ਼ ਹਨ। ਮੁੱਖ ਜੋਖਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਭਰਮ (hallucination) ਹੈ, ਜਿੱਥੇ ਇੱਕ ਮਾਡਲ ਭਰੋਸੇ ਨਾਲ ਅਜਿਹੇ ਵਿਅਕਤੀ ਬਾਰੇ ਜੀਵਨੀ ਦੇ ਵੇਰਵੇ ਬਣਾ ਸਕਦਾ ਹੈ ਜੋ ਮੌਜੂਦ ਨਹੀਂ ਹੈ ਜਾਂ ਤੱਥਾਂ ਨੂੰ ਗਲਤ ਤਰੀਕੇ ਨਾਲ ਜੋੜ ਸਕਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਸਟ੍ਰੈਂਥ ਸਕੋਰ ਦੀ ਸ਼ੁੱਧਤਾ ਇਨਪੁਟ ਦੀ ਗੁਣਵੱਤਾ ਪ੍ਰਤੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ; ਸਧਾਰਨ ਟਾਈਪਿੰਗ ਦੀਆਂ ਗਲਤੀਆਂ ਸਕੋਰ ਨੂੰ ਕਾਫ਼ੀ ਹੇਠਾਂ ਲਿਆ ਸਕਦੀਆਂ ਹਨ, ਅਤੇ ਆਮ ਨਾਮ ਅਕਸਰ ਅਸਪਸ਼ਟ ਨਤੀਜੇ ਦਿੰਦੇ ਹਨ ਕਿਉਂਕਿ ਮਾਡਲ ਇੱਕੋ ਨਾਮ ਵਾਲੇ ਵੱਖ-ਵੱਖ ਵਿਅਕਤੀਆਂ ਵਿੱਚ ਅੰਤਰ ਕਰਨ ਵਿੱਚ ਮੁਸ਼ਕਲ ਮਹਿਸੂਸ ਕਰਦਾ ਹੈ। ਇਹ ਵਸਤੂਨਿਸ਼ਠ ਜੀਵਨੀ ਤੱਥਾਂ ਨੂੰ ਮਾਪਣ ਲਈ ਸੰਭਾਵਨਾਤਮਕ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਦੀ ਗੁੰਝਲਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ।

ਇਹ AI ਲੈਂਡਸਕੇਪ ਲਈ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਜਿਵੇਂ-ਜਿਵੇਂ AI ਮਾਡਲ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁੱਖ ਇੰਟਰਫੇਸ ਬਣਦੇ ਜਾ ਰਹੇ ਹਨ, ਉਹ ਡਿਫੌਲਟ ਰੂਪ ਵਿੱਚ ਕੀ "ਜਾਣਦੇ" ਹਨ, ਇਸ ਨੂੰ ਸਮਝਣਾ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ, "In the Weights" ਮਾਡਲ ਦੇ ਪੈਮਾਨੇ ਅਤੇ ਡੇਟਾ ਦੀ ਘਣਤਾ ਵਿਚਕਾਰ ਤਣਾਅ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਇਹ ਨਿੱਜਤਾ ਅਤੇ "ਭੁੱਲ ਜਾਣ ਦੇ ਅਧਿਕਾਰ" (right to be forgotten) ਦੇ ਸਬੰਧ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸਵਾਲ ਵੀ ਖੜ੍ਹੇ ਕਰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਉਸ ਯੁੱਗ ਵਿੱਚ ਜਿੱਥੇ ਸਾਡੀਆਂ ਡਿਜੀਟਲ ਪਛਾਣਾਂ ਨੂੰ ਪ੍ਰੋਪਰਾਈਟਰੀ ਮਾਡਲਾਂ ਦੇ ਸਥਾਈ ਗਣਨਾਤਮਕ ਵੇਟਸ (numerical weights) ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ।

ਮੁੱਖ ਨੁਕਤੇ

  • AI ਮੈਮੋਰੀ ਨੂੰ ਮਾਪਣਾ: "In the Weights" ਇੱਕ ਸਟ੍ਰੈਂਥ ਸਕੋਰ (996 ਤੱਕ) ਦੀ ਵਰਤੋਂ ਇਹ ਮਾਪਣ ਲਈ ਕਰਦਾ ਹੈ ਕਿ ਕਿਸੇ ਵਿਅਕਤੀ ਦੀ ਪਛਾਣ ਮਾਡਲ ਦੇ ਵੇਟਸ ਵਿੱਚ ਕਿੰਨੀ ਡੂੰਘਾਈ ਨਾਲ ਦਰਜ ਹੈ।
  • ਪ੍ਰਸੰਗਿਕਤਾ ਬੈਂਚਮਾਰਕ: ਮੈਟਾ ਦੇ Llama ਵਰਗੇ ਛੋਟੇ ਅਤੇ ਪੈਰਾਮੀਟਰ-ਕੁਸ਼ਲ ਮਾਡਲਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦੇਣਾ ਮਾਡਲ ਦੇ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਨਾਲ ਉੱਚ ਪੱਧਰੀ ਸਬੰਧ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
  • ਤਕਨੀਕੀ ਸੀਮਾਵਾਂ: ਇਸ ਟੂਲ ਨੂੰ LLM ਦੀਆਂ ਆਮ ਮੁਸ਼ਕਲਾਂ, ਜਿਵੇਂ ਕਿ ਭਰਮ (hallucinations), ਨਾਮ ਦੀ ਅਸਪਸ਼ਟਤਾ, ਅਤੇ ਟਾਈਪਿੰਗ ਦੀਆਂ ਗਲਤੀਆਂ ਪ੍ਰਤੀ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਨਾਲ ਨਜਿੱਠਣਾ ਪੈਂਦਾ ਹੈ।