Meta 的 Brain2Qwerty v2:弥合非侵入式脑控文本 AI 的差距
Meta 在神经技术领域的最新突破正让我们离无需手术的无缝脑机接口更近一步。通过利用先进的语言模型和海量数据集,Brain2Qwerty v2 系统展示了非侵入式传感器如何将神经活动转化为连贯的文本。
超越手术植入式技术
多年来,高准确度的脑控文本通信一直需要通过侵入式手术植入物来实现低错误率。虽然目前的植入式系统在词错误率 (WER) 上处于领先地位(低于 2%),但 Meta 使用脑磁图 (MEG) 的非侵入式方法正在迅速缩小差距。通过测量颅外的磁场,Meta 基础人工智能研究 (FAIR) 实验室的研究人员可以捕捉运动皮层活动——即当一个人意图移动手指时发送的信号——从而重建输入的句子。
这项研究的规模非常显著:研究人员对九名健康志愿者进行了每人十小时的记录,最终得到了包含 22,000 个句子的数据集。与之前的 Brain2Qwerty v1 相比,数据量增加了十倍,这使得模型不再需要精确的按键时间戳,而是转向异步的连续信号窗口。
大语言模型 (LLM) 集成的力量
Brain2Qwerty v2 的核心创新在于集成了经过微调的语言模型 Qwen3,将其作为语义“平滑器”。该系统在三个不同的层面处理信号:字符、单词和完整句子。
结果显示了字符精确度与语义含义之间一种有趣的权衡:
- 词错误率 (WER): v2 模型的平均 WER 达到了 39%,相比原始编码器的 55% 以及 v1 N-gram 模型的 43% 有了巨大的提升。
- 字符错误率 (CER): 有趣的是,v2 的 CER 为 31%,实际上高于原始编码器 (28%)。
这是因为 Qwen3 语言模型优先考虑流畅度和语法。如果神经信号存在噪声,LLM 会“幻觉”出一个语法正确的句子,但该句子可能与预期的字符不符。然而,对于临床应用而言,传达预期含义(语义准确性)的能力远比完美的逐字拼写更为关键。
AI 驱动的研究优化
在一种创新的元方法中,Meta 利用了三个基于 Claude Opus 4.6 的独立 AI 智能体来优化模型代码。这些智能体成功识别了诸如标签平滑 (label smoothing) 和模态丢弃 (modality dropout) 等高性能技术,表现优于标准的人工设计优化方法。虽然这些智能体在处理开放式任务和复杂代码稳定性方面表现挣扎,但它们在微调超参数方面的成功,凸显了一个 AI 加速神经技术工具开发的新时代。
随着 Meta 探索便携式、室温下的 MEG 传感器,为运动障碍人士开发实时、非侵入式通信设备的道路正变得越来越清晰。
核心要点
- 语义飞跃: 通过集成 Qwen3 语言模型,Brain2Qwerty v2 将词错误率显著降低至 39%,优先考虑含义而非原始字符准确度。
- 异步处理: 新模型不再需要精确的按键计时,使该技术更接近实时、非侵入式的应用。
- AI 优化模型: Meta 成功利用基于 Claude Opus 的智能体,实现了神经解码代码优化过程的自动化与改进。
