ਐਮਬੈਡਿੰਗਜ਼ ਮੈਜਿਕ

ਐਮਬੈਡਿੰਗਜ਼ ਭਾਸ਼ਾ ਨੂੰ ਗਣਿਤ ਵਿੱਚ ਬਦਲ ਦਿੰਦੇ ਹਨ।

ਇਹ ਆਧੁਨਿਕ AI ਦੀ ਨੀਂਹ ਹਨ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਇਨ੍ਹਾਂ ਨੂੰ ਇੱਕ ਬਲੈਕ ਬਾਕਸ ਵਾਂਗ ਮੰਨਦੇ ਹਨ। ਇਹ ਪੋਸਟ ਸਮਝਾਉਂਦੀ ਹੈ ਕਿ ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ।

ਜਦੋਂ ਸ਼ਬਦ ਮੇਲ ਨਹੀਂ ਖਾਂਦੇ ਤਾਂ ਕੀਵਰਡ ਸਰਚ ਅਸਫਲ ਹੋ ਜਾਂਦੀ ਹੈ।

ਜੇਕਰ ਤੁਸੀਂ "How do I reset my password?" ਲੱਭਦੇ ਹੋ, ਤਾਂ ਕੀਵਰਡ ਸਰਚ ਬਿਲਕੁਲ ਉਹਨਾਂ ਹੀ ਸ਼ਬਦਾਂ ਨੂੰ ਲੱਭਦੀ ਹੈ। ਜੇਕਰ ਕੋਈ ਦਸਤਾਵੇਜ਼ "Steps to recover your account credentials" ਲਿਖਦਾ ਹੈ, ਤਾਂ ਸਰਚ ਅਸਫਲ ਹੋ ਸਕਦੀ ਹੈ। ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਮਤਲਬ ਇੱਕੋ ਹੀ ਹੈ। ਕੰਪਿਊਟਰ ਨਹੀਂ ਜਾਣਦੇ।

ਐਮਬੈਡਿੰਗਜ਼ ਇਸ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਦੇ ਹਨ।

ਇੱਕ ਐਮਬੈਡਿੰਗ ਨੰਬਰਾਂ ਦੀ ਇੱਕ ਸੂਚੀ ਹੁੰਦੀ ਹੈ। ਇਹ ਨੰਬਰ ਟੈਕਸਟ ਦੇ ਅਰਥਾਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। ਇੱਕ ਐਮਬੈਡਿੰਗ ਮਾਡਲ ਸ਼ਬਦਾਂ ਨੂੰ ਇੱਕ ਉੱਚ-ਡਾਇਮੈਂਸ਼ਨਲ ਸਪੇਸ (high dimensional space) ਵਿੱਚ ਮੈਪ ਕਰਦਾ ਹੈ।

"cat" ਵਰਗਾ ਇੱਕ ਸਿੰਗਲ ਸ਼ਬਦ ਇੱਕ ਵੈਕਟਰ ਬਣ ਜਾਂਦਾ ਹੈ: [0.18, -0.42, 0.91, ...]

ਸਿਰਫ਼ ਨੰਬਰਾਂ ਦਾ ਕੋਈ ਮਤਲਬ ਨਹੀਂ ਹੁੰਦਾ। ਜੋ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ ਉਹ ਹੈ ਵੈਕਟਰ ਦੀ ਸਥਿਤੀ।

ਇੱਕ ਨਕਸ਼ੇ ਬਾਰੇ ਸੋਚੋ। ਇੱਕ ਦੂਜੇ ਦੇ ਨੇੜੇ ਸਥਿਤ ਸ਼ਹਿਰਾਂ ਦਾ ਜਲਵਾਯੂ ਅਤੇ ਸਰਹੱਦਾਂ ਸਮਾਨ ਹੁੰਦੀਆਂ ਹਨ। ਐਮਬੈਡਿੰਗਜ਼ ਵੀ ਇਸੇ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦੇ ਹਨ। ਸਮਾਨ ਅਰਥ ਰੱਖਣ ਵਾਲਾ ਟੈਕਸਟ ਵੈਕਟਰ ਸਪੇਸ ਵਿੱਚ ਇੱਕ ਦੂਜੇ ਦੇ ਨੇੜੇ ਹੁੰਦਾ ਹੈ।

  • ਕੁੱਤਾ (Dog) ਅਤੇ ਬਿੱਲੀ (Cat) ਇੱਕ ਦੂਜੇ ਦੇ ਨੇੜੇ ਹੁੰਦੇ ਹਨ।
  • ਕਾਰ (Car) ਅਤੇ ਟਰੱਕ (Truck) ਇੱਕ ਦੂਜੇ ਦੇ ਨੇੜੇ ਹੁੰਦੇ ਹਨ।
  • ਕਾਰ (Car) ਅਤੇ ਕੁੱਤਾ (Dog) ਇੱਕ ਦੂਜੇ