ਕਿਵੇਂ General Intuition ਅਸਲੀ ਦੁਨੀਆ ਦੇ AI ਨੂੰ ਬਣਾਉਣ ਲਈ ਵੀਡੀਓ ਗੇਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ

General Intuition ਭੌਤਿਕ ਸੰਸਾਰ ਲਈ agentic models ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵੀਡੀਓ ਗੇਮਾਂ ਦੇ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਰੋਬੋਟਿਕਸ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਪੈਰਾਡਾਈਮ ਸ਼ਿਫਟ (paradigm shift) ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੈ। $320 ਮਿਲੀਅਨ ਦੇ ਨਵੇਂ ਫੰਡਿੰਗ ਰਾਊਂਡ ਦੇ ਨਾਲ, ਇਹ ਸਟਾਰਟਅੱਪ ਦਾਅ ਲਗਾ ਰਿਹਾ ਹੈ ਕਿ ਗੇਮਿੰਗ ਵਿੱਚ ਮਿਲਣ ਵਾਲਾ "action data" ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਲਈ ਗੁੰਮ ਹੋਈ ਕੜੀ ਹੈ।

ਐਕਸ਼ਨ ਲੇਬਲਜ਼ ਅਤੇ ਸਪੇਸ਼ੀਅਲ-ਟੈਂਪੋਰਲ ਰੀਜ਼ਨਿੰਗ ਦੀ ਸ਼ਕਤੀ

ਜਦੋਂ ਕਿ ਬਹੁਤ ਸਾਰੇ AI ਖੋਜਕਰਤਾ ਸਿਰਫ਼ ਵੀਡੀਓ ਫੁਟੇਜ ਦੇਖ ਕੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ, General Intuition ਦੇ CEO Pim de Witte ਦਾ ਤਰਕ ਹੈ ਕਿ ਸਿਰਫ਼ ਵੀਡੀਓ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ। ਕੰਪਨੀ ਦੀ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦੀ ਤਾਕਤ Medal ਤੋਂ ਪ੍ਰਾਪਤ ਵਿਸ਼ੇਸ਼ ਡੇਟਾ ਵਿੱਚ ਹੈ, ਜੋ ਇੱਕ ਅਜਿਹਾ ਪਲੇਟਫਾਰਮ ਹੈ ਜਿੱਥੇ ਉਪਭੋਗਤਾ ਵੀਡੀਓ ਗੇਮ ਕਲਿੱਪ ਸਾਂਝੇ ਕਰਦੇ ਹਨ।

ਆਮ ਵੀਡੀਓ ਦੇ ਉਲਟ, ਇਹ ਕਲਿੱਪਾਂ "action labels" ਨਾਲ ਭਰਪੂਰ ਹੁੰਦੀਆਂ ਹਨ—ਜਿਸ ਵਿੱਚ ਸਹੀ ਰਿਕਾਰਡ ਹੁੰਦਾ ਹੈ ਕਿ ਖਿਡਾਰੀ ਨੇ ਕਿਹੜੇ ਬਟਨ ਦਬਾਏ ਅਤੇ ਬਿਲਕੁਲ ਕਦੋਂ। ਇਹ ਮਾਡਲ ਨੂੰ ਸਿਰਫ਼ ਪੈਟਰਨ ਪਛਾਣਨ ਤੋਂ ਅੱਗੇ ਵਧਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ; ਇਹ spatial-temporal reasoning ਸਿੱਖਦਾ ਹੈ। ਇੱਕ ਖਾਸ ਇਨਪੁਟ (ਇੱਕ ਐਕਸ਼ਨ) ਅਤੇ ਵਾਤਾਵਰਣ ਵਿੱਚ ਹੋਣ ਵਾਲੇ ਨਤੀਜਾਤਮਕ ਬਦਲਾਅ (ਪ੍ਰਤੀਕਿਰਿਆ) ਦੇ ਵਿਚਕਾਰ ਸਿੱਧੇ ਸਬੰਧ ਨੂੰ ਸਮਝ ਕੇ, AI ਕਾਰਨ-ਪ੍ਰਭਾਵ (causality) ਨੂੰ ਸਮਝਣਾ ਸ਼ੁਰੂ ਕਰ ਦਿੰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ "ਆਪਣੇ ਆਪ" (self) ਨੂੰ "ਵਾਤਾਵਰਣ" (environment) ਤੋਂ ਵੱਖ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕਿਸੇ ਵੀ autonomous agent ਲਈ ਇੱਕ ਮੂਲ ਲੋੜ ਹੈ।

Fortnite ਤੋਂ ਲੈ ਕੇ Quadruped Robots ਤੱਕ

ਕੰਪਨੀ ਦੀ ਤਕਨੀਕੀ ਇੱਛਾ ਇੱਕ ਅਜਿਹਾ ਸਿੰਗਲ ਮਾਡਲ ਬਣਾਉਣਾ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ: ਗੇਮਪਲੇ, ਸਿਮੂਲੇਸ਼ਨ, ਅਤੇ ਭੌਤਿਕ ਰੂਪ (physical embodiment) ਵਿੱਚ ਕੰਮ ਕਰ ਸਕੇ। ਹਾਲ ਹੀ ਦੇ ਪ੍ਰਦਰਸ਼ਨਾਂ ਵਿੱਚ, ਗੇਮਪਲੇ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਇੱਕ AI ਏਜੰਟ ਗੁੰਝਲਦਾਰ ਵਰਚੁਅਲ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਚੱਲਣ ਦੇ ਯੋਗ ਸੀ, ਅਤੇ ਇਹ ਸਮਝ ਸਕਦਾ ਸੀ ਕਿ ਕੰਧਾਂ ਠੋਸ ਵਸਤੂਆਂ ਹਨ ਅਤੇ ਸੂਰਜ ਦੀ ਗਤੀ ਦੇ ਨਾਲ ਪਰਛਾਵੇਂ ਬਦਲਦੇ ਹਨ।

ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਸ "ਦਿਮਾਗ" ਨੂੰ ਸਿੱਧਾ ਹਾਰਡਵੇਅਰ ਵਿੱਚ ਪੋਰਟ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਕੰਪਨੀ ਨੇ ਇੱਕ quadrupedal ਰੋਬੋਟ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਜੋ ਉਸੇ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਸੀ ਜੋ ਇਸਦੇ ਗੇਮਿੰਗ ਏਜੰਟਾਂ ਨੂੰ ਚਲਾਉਂਦਾ ਹੈ। ਖਾਸ ਤੌਰ 'ਤੇ, ਟੀਮ ਨੇ ਦੱਸਿਆ ਕਿ ਰੋਬੋਟ ਦੇ ਨੈਵੀਗੇਸ਼ਨ ਲਈ ਮਾਡਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਲਈ ਅਸਲੀ ਸੜਕਾਂ ਤੋਂ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਰੋਬੋਟਿਕਸ ਡੇਟਾ ਦੇ ਸਿਰਫ਼ ਅੱਠ ਮਿੰਟ ਹੀ ਲੱਗੇ। ਇਹ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਭੌਤਿਕ ਵਿਗਿਆਨ (physics) ਅਤੇ spatial awareness ਸਿੱਖਣ ਦਾ ਵੱਡਾ ਕੰਮ ਵੀਡੀਓ ਗੇਮਾਂ ਦੇ "gym" ਵਿੱਚ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ, ਜਿਸ ਨਾਲ ਅਸਲੀ ਦੁਨੀਆ ਵਿੱਚ ਇਸਦੀ ਵਰਤੋਂ ਕਾਫ਼ੀ ਵਧੇਰੇ ਕੁਸ਼ਲ ਹੋ ਜਾਂਦੀ ਹੈ।

ਜਨਰਲ ਏਜੰਟਾਂ 'ਤੇ $2.3 ਬਿਲੀਅਨ ਦਾ ਦਾਅ

ਇਸ ਇੱਛਾ ਦਾ ਪੈਮਾਨਾ ਕੰਪਨੀ ਦੇ ਮੁਲਾਂਕਣ ਵਿੱਚ ਸਾਫ਼ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ। General Intuition ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ $2.3 ਬਿਲੀਅਨ ਦੇ ਮੁਲਾਂਕਣ 'ਤੇ $320 ਮਿਲੀਅਨ ਇਕੱਠੇ ਕੀਤੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਸਦੀ ਕੁੱਲ disclosed ਫੰਡਿੰਗ $454 ਮਿਲੀਅਨ ਹੋ ਗਈ ਹੈ। ਇਸ ਰਾਊਂਡ ਦੀ ਅਗਵਾਈ Khosla Ventures ਨੇ ਕੀਤੀ, ਜਿਸ ਵਿੱਚ General Catalyst, Jeff Bezos, Eric Schmidt, ਅਤੇ Google DeepMind ਅਤੇ MIT ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਵੱਡੀ ਭਾਗੀਦਾਰੀ ਰਹੀ।

ਇਹ ਪੂੰਜੀ ਦੋ ਮੁੱਖ ਟੀਚਿਆਂ ਲਈ ਰਾਖਵੀਂ ਰੱਖੀ ਗਈ ਹੈ: CoreWeave ਦੇ ਨਾਲ ਭਾਈਵਾਲੀ ਰਾਹੀਂ ਕੰਪਿਊਟ ਸਮਰੱਥਾ ਨੂੰ ਵਧਾਉਣਾ ਅਤੇ ਗਰਮੀਆਂ ਦੇ ਅੰਤ ਤੱਕ ਆਪਣੀ API ਨੂੰ ਵਧੇਰੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਕਰਵਾਉਣਾ। Vinod Khosla ਵਰਗੇ ਨਿਵੇਸ਼ਕਾਂ ਲਈ, ਟੀਚਾ ਸਿਰਫ਼ ਬਿਹਤਰ ਆਟੋਮੇਸ਼ਨ ਨਹੀਂ ਹੈ, ਸਗੋਂ "AI intuition" ਦਾ ਉਭਾਰ ਹੈ—ਸਿਰਫ਼ ਪ੍ਰੋਗਰਾਮ ਕੀਤੇ ਗਏ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦੀ ਬਜਾਏ, ਸਮਝ ਰਾਹੀਂ ਦੁਨੀਆ ਵਿੱਚ ਚੱਲਣ ਦੀ ਇੱਕ ਮਨੁੱਖੀ ਸਮਰੱਥਾ।

ਮੁੱਖ ਗੱਲਾਂ

  • ਐਕਸ਼ਨ-ਡ੍ਰਿਵਨ ਸਿਖਲਾਈ: General Intuition ਵੀਡੀਓ-ਸਿਰਫ਼ ਸਿਖਲਾਈ ਦੀਆਂ ਸੀਮਾਵਾਂ ਤੋਂ ਅੱਗੇ ਵਧਣ ਲਈ ਗੇਮਿੰਗ ਕਲਿੱਪਾਂ ਤੋਂ ਬਟਨ-ਪ੍ਰੈੱਸ "action labels" ਦੀ ਵਰਤੋਂ ਕਰਕੇ AI ਨੂੰ causality ਸਿਖਾਉਂਦਾ ਹੈ।
  • ਸਕੇਲੇਬਲ ਸਿਮੂਲੇਸ਼ਨ: ਵੀਡੀਓ ਗੇਮਾਂ ਨੂੰ "gym" ਵਜੋਂ ਵਰਤ ਕੇ, ਕੰਪਨੀ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਰੋਬੋਟਿਕ ਡੇਟਾ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਦੇ ਭਾਰੀ ਖਰਚੇ ਤੋਂ ਬਿਨਾਂ ਗੁੰਝਲਦਾਰ spatial-temporal reasoning ਨੂੰ ਸਿਖਾ ਸਕਦੀ ਹੈ।
  • ਵੱਡਾ ਸੰਸਥਾਗਤ ਸਮਰਥਨ: $2.3 ਬਿਲੀਅਨ ਦੇ ਮੁਲਾਂਕਣ ਅਤੇ Jeff Bezos ਅਤੇ Eric Schmidt ਵਰਗੀਆਂ ਸ਼ਖਸੀਅਤਾਂ ਦੇ ਸਮਰਥਨ ਦੇ ਨਾਲ, ਕੰਪਨੀ ਆਪਣੇ ਆਪ ਨੂੰ world model ਯੁੱਗ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਖਿਡਾਰੀ ਵਜੋਂ ਸਥਾਪਿਤ ਕਰ ਰਹੀ ਹੈ।