Meta ਦਾ Brain2Qwerty v2: Non-Invasive Brain-to-Text AI ਵਿੱਚ ਪਾੜੇ ਨੂੰ ਪੂਰਨਾ
ਨਿਊਰੋਟੈਕਨਾਲੋਜੀ ਵਿੱਚ Meta ਦੀ ਤਾਜ਼ਾ ਕਾਢ ਸਾਨੂੰ ਸਰਜਰੀ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਬਿਨਾਂ ਰੁਕਾਵਟ ਵਾਲੇ ਬ੍ਰੇਨ-ਕੰਪਿਊਟਰ ਇੰਟਰਫੇਸਾਂ ਦੇ ਹੋਰ ਨੇੜੇ ਲਿਆ ਰਹੀ ਹੈ। ਉੱਨਤ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਅਤੇ ਵਿਸ਼ਾਲ ਡੇਟਾ ਸੈੱਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, Brain2Qwerty v2 ਸਿਸਟਮ ਇਹ ਦਿਖਾ ਰਿਹਾ ਹੈ ਕਿ ਕਿਵੇਂ non-invasive ਸੈਂਸਰ ਨਿਊਰਲ ਗਤੀਵਿਧੀ ਨੂੰ ਸੁਸੰਗਤ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲ ਸਕਦੇ ਹਨ।
ਸਰਜੀਕਲ ਇੰਪਲਾਂਟਸ ਤੋਂ ਅੱਗੇ ਵਧਣਾ
ਸਾਲਾਂ ਤੋਂ, ਘੱਟ ਗਲਤੀ ਦੀ ਦਰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਉੱਚ-ਸ਼ੁੱਧਤਾ ਵਾਲੇ ਬ੍ਰੇਨ-ਟੂ-ਟੈਕਸਟ ਸੰਚਾਰ ਲਈ ਇਨਵੇਸਿਵ ਸਰਜੀਕਲ ਇੰਪਲਾਂਟਸ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ। ਜਦੋਂ ਕਿ ਇੰਪਲਾਂਟ ਕੀਤੇ ਗਏ ਸਿਸਟਮਾਂ ਦੀ ਵਰਤਮਾਨ ਵਿੱਚ word error rates (WER) 2% ਤੋਂ ਘੱਟ ਹੈ, Meta ਦਾ Magnetoencephalography (MEG) ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲਾ non-invasive ਤਰੀਕਾ ਤੇਜ਼ੀ ਨਾਲ ਇਸ ਪਾੜੇ ਨੂੰ ਘਟਾ ਰਿਹਾ ਹੈ। ਖੋਪੜੀ ਦੇ ਬਾਹਰ ਚੁੰਬਕੀ ਖੇਤਰਾਂ ਨੂੰ ਮਾਪ ਕੇ, Meta ਦੇ Fundamental AI Research (FAIR) ਲੈਬ ਦੇ ਖੋਜਕਰਤਾ ਮੋਟਰ ਕੋਰਟੈਕਸ ਗਤੀਵਿਧੀ—ਜਦੋਂ ਕੋਈ ਵਿਅਕਤੀ ਆਪਣੀਆਂ ਉਂਗਲਾਂ ਹਿਲਾਉਣ ਦਾ ਇਰਾਦਾ ਰੱਖਦਾ ਹੈ ਤਾਂ ਭੇਜੇ ਜਾਣ ਵਾਲੇ ਸੰਕੇਤ—ਨੂੰ ਕੈਪਚਰ ਕਰ ਸਕਦੇ ਹਨ ਤਾਂ ਜੋ ਟਾਈਪ ਕੀਤੇ ਵਾਕਾਂ ਨੂੰ ਮੁੜ ਸਿਰਜਿਆ ਜਾ ਸਕੇ।
ਇਸ ਅਧਿਐਨ ਦਾ ਪੈਮਾਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ: ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਨੌਂ ਸਿਹਤਮੰਦ ਵਲੰਟੀਅਰਾਂ ਨੂੰ ਹਰੇਕ ਲਈ ਦਸ ਘੰਟੇ ਰਿਕਾਰਡ ਕੀਤਾ, ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ 22,000 ਵਾਕਾਂ ਦਾ ਇੱਕ ਡੇਟਾ ਸੈੱਟ ਪ੍ਰਾਪਤ ਹੋਇਆ। ਇਹ ਪਿਛਲੇ Brain2Qwerty v1 ਦੇ ਮੁਕਾਬਲੇ ਡੇਟਾ ਵਿੱਚ ਦਸ ਗੁਣਾ ਵਾਧਾ ਹੈ, ਜੋ ਮਾਡਲ ਨੂੰ ਸਹੀ keystroke timestamps ਦੀ ਲੋੜ ਤੋਂ ਦੂਰ ਹੋ ਕੇ ਇੱਕ asynchronous, continuous signal window ਵੱਲ ਵਧਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।
LLM ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਦੀ ਸ਼ਕਤੀ
Brain2Qwerty v2 ਵਿੱਚ ਮੁੱਖ ਨਵੀਨਤਾ ਇੱਕ fine-tuned ਭਾਸ਼ਾ ਮਾਡਲ, Qwen3, ਦਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਹੈ, ਜੋ ਇੱਕ semantic "smoother" ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ। ਸਿਸਟਮ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਪੱਧਰਾਂ 'ਤੇ ਸੰਕੇਤਾਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ: ਅੱਖਰ (characters), ਸ਼ਬਦ (words), ਅਤੇ ਪੂਰੇ ਵਾਕ (full sentences)।
ਨਤੀਜੇ ਅੱਖਰਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਅਤੇ semantic ਅਰਥਾਂ ਵਿਚਕਾਰ ਇੱਕ ਦਿਲਚਸਪ ਤਾਲਮੇਲ ਦਿਖਾਉਂਦੇ ਹਨ:
- Word Error Rate (WER): v2 ਮਾਡਲ ਨੇ 39% ਦਾ ਔਸਤ WER ਪ੍ਰਾਪਤ ਕੀਤਾ, ਜੋ ਕਿ raw encoder ਵਿੱਚ ਦੇਖੇ ਗਏ 55% ਅਤੇ v1 N-gram ਮਾਡਲ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੇ ਗਏ 43% ਦੇ ਮੁਕਾਬਲੇ ਇੱਕ ਵੱਡਾ ਸੁਧਾਰ ਹੈ।
- Character Error Rate (CER): ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ v2 ਲਈ CER 31% ਸੀ, ਜੋ ਕਿ ਅਸਲ ਵਿੱਚ raw encoder (28%) ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਸੀ।
ਇਹ ਇਸ ਲਈ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ Qwen3 ਭਾਸ਼ਾ ਮਾਡਲ ਰਵਾਨਗੀ (fluency) ਅਤੇ ਵਿਆਕਰਣ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦਾ ਹੈ। ਜੇਕਰ ਨਿਊਰਲ ਸਿਗਨਲ ਵਿੱਚ ਸ਼ੋਰ (noise) ਹੈ, ਤਾਂ LLM ਇੱਕ ਵਿਆਕਰਣਕ ਤੌਰ 'ਤੇ ਸਹੀ ਵਾਕ "hallucinates" ਕਰਦਾ ਹੈ ਜੋ ਸ਼ਾਇਦ ਇਰਾਦਤ ਅੱਖਰਾਂ ਨਾਲ ਮੇਲ ਨਾ ਖਾਵੇ। ਹਾਲਾਂਕਿ, ਕਲੀਨਿਕਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ, ਇਰਾਦਤ ਅਰਥ (semantic accuracy) ਨੂੰ ਦਰਸਾਉਣ ਦੀ ਯੋਗਤਾ ਅੱਖਰ-ਦਰ-ਅੱਖਰ ਸਹੀ ਸਪੈਲਿੰਗ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੈ।
AI-ਡਰਾਈਵਨ ਰਿਸਰਚ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ
ਨਵੀਨਤਾ ਦੇ ਇੱਕ ਮੇਟਾ-ਅਪ੍ਰੋਚ ਵਿੱਚ, Meta ਨੇ ਮਾਡਲ ਦੇ ਕੋਡ ਨੂੰ ਆਪਟੀਮਾਈਜ਼ ਕਰਨ ਲਈ Claude Opus 4.6 'ਤੇ ਅਧਾਰਤ ਤਿੰਨ ਸੁਤੰਤਰ AI agents ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਹਨਾਂ agents ਨੇ label smoothing ਅਤੇ modality dropout ਵਰਗੀਆਂ ਉੱਚ-ਕਾਰਗੁਜ਼ਾਰੀ ਤਕਨੀਕਾਂ ਦੀ ਸਫਲਤਾਪੂਰਵਕ ਪਛਾਣ ਕੀਤੀ, ਜੋ ਕਿ ਮਨੁੱਖ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਮਿਆਰੀ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਵਿਧੀਆਂ ਨਾਲੋਂ ਬਿਹਤਰ ਸਨ। ਹਾਲਾਂਕਿ agents ਨੂੰ open-ended ਕੰਮਾਂ ਅਤੇ ਗੁੰਝਲਦਾਰ ਕੋਡ ਸਥਿਰਤਾ ਨਾਲ ਸੰਘਰਸ਼ ਕਰਨਾ ਪਿਆ, ਪਰ hyperparameters ਨੂੰ fine-tune ਕਰਨ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਸਫਲਤਾ ਇੱਕ ਨਵੇਂ ਯੁੱਗ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ ਜਿੱਥੇ AI ਨਿਊਰੋਟੈਕਨੋਲੋਜੀਕਲ ਸਾਧਨਾਂ ਦੇ ਵਿਕਾਸ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ।
ਜਿਵੇਂ ਕਿ Meta ਪੋਰਟੇਬਲ, ਰੂਮ-ਟੈਂਪਰੇਚਰ MEG ਸੈਂਸਰਾਂ ਦੀ ਖੋਜ ਕਰ ਰਿਹਾ ਹੈ, ਮੋਟਰ ਅਪੰਗਤਾ ਵਾਲੇ ਵਿਅਕਤੀਆਂ ਲਈ ਰੀਅਲ-ਟਾਈਮ, non-invasive ਸੰਚਾਰ ਯੰਤਰ ਵੱਲ ਦਾ ਰਾਹ ਹੋਰ ਵੀ ਸਪਸ਼ਟ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ।
ਮੁੱਖ ਗੱਲਾਂ (Key Takeaways)
- Semantic Leap: Qwen3 ਭਾਸ਼ਾ ਮਾਡਲ ਨੂੰ ਜੋੜ ਕੇ, Brain2Qwerty v2 ਨੇ word error rates ਨੂੰ ਕਾਫ਼ੀ ਘਟਾ ਕੇ 39% ਕਰ ਦਿੱਤਾ, ਜਿਸ ਵਿੱਚ ਅੱਖਰਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਦੀ ਬਜਾਏ ਅਰਥ ਨੂੰ ਤਰਜੀਹ ਦਿੱਤੀ ਗਈ।
- Asynchronous Processing: ਨਵੇਂ ਮਾਡਲ ਨੂੰ ਹੁਣ ਸਹੀ keystroke timing ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਜੋ ਤਕਨਾਲੋਜੀ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ, non-invasive ਵਰਤੋਂ ਦੇ ਹੋਰ ਨੇੜੇ ਲੈ ਜਾਂਦੀ ਹੈ।
- AI-Optimized Models: Meta ਨੇ ਨਿਊਰਲ ਡੀਕੋਡਿੰਗ ਕੋਡ ਦੇ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਨੂੰ ਆਟੋਮੇਟ ਕਰਨ ਅਤੇ ਸੁਧਾਰਨ ਲਈ Claude Opus-ਅਧਾਰਤ agents ਦੀ ਸਫਲਤਾਪੂਰਵਕ ਵਰਤੋਂ ਕੀਤੀ।
