八年前,一名女性因罹患肌萎缩侧索硬化症(ALS,即渐冻症)而丧失了语言能力。患病之后,虽然她依然可以发出声音,但她说出的话已经变得难以理解,平日只能依靠书写板或 iPad 进行交流。现在,在自愿接受了一项脑机接口(BCI)植入试验之后,她已经能够以接近正常语言的速度与人快速交流。

  日前,来自斯坦福大学的一个研究团队在预印本平台 bioRxiv 上发表了题为:A high-performance speech neuroprosthesis 的最新研究论文。

  该研究通过脑机接口(BCI)将与语音相关的神经活动转化为文本,从而使因患有中风和 ALS 等疾病而无法顺畅交流的人群受益。

  该研究开发了首个用于记录皮质内微电极阵列脉冲活动的语音转文本脑机接口。研究人员表示,在脑机植入物的帮助下,该研究受试者能够以每分钟 62 个单词的速度进行交流,打破了之前的记录,是此前最佳水平的三倍。该论文尚未经过其它研究人员的正式审查。

  对于没有言语障碍的普通人而言,常规的发言速度通常为每分钟约 160 个单词。即使在依靠键盘输入、且充斥了表情符号和缩写的现代,语音交流仍然是人与人之间最快的沟通方式。

  该论文的第一作者 Francis Willett 来自斯坦福大学霍华德休斯医学研究所。早在 2021 年 5 月,他的团队曾率先破译与手写相关的大脑活动,并且开发了一种皮质内 BCI 系统,通过解码神经信号从而允许瘫痪患者通过想象完成手写输入,发表在了 Nature 杂志并被选为封面论文。

  现在,研究团队想知道运动皮层中的神经元是否也包含有关语言运动的有用信息?也就是说,脑机植入物能否在受试者还未说话时便已经检测到他将如何控制嘴巴、舌头和声带的运动方式?

  为了实现这一目标,研究团队使用一小块尖锐电极嵌入人的运动皮层,该电极使用四个微电极阵列记录神经活动。由于运动皮层是运动反馈最多的大脑区域,因此研究人员可以通过其神经元活动信号找到某人正在思考的动作模式,即使这个人已经瘫痪。

  研究发现,即便使用单个微电极阵列也可以清楚地表示出语音和发声运动,不同运动之间的神经活动能够实现准确区分。而结合了四个微电极阵列的活动记录后,通过朴素贝叶斯分类算法,该技术对于 34 个口面部运动的解码准确率为 92.7%,对于 39 个音素(根据语音的自然属性划分出来的最小语音单位)的解码准确率为 60%。在此之后,计算机会将这些信息传送到电脑屏幕上,通过屏幕和语音输出系统展示出患者的“心里话”。

  该团队针对一名患有 ALS 的受试者(被称为“T12 受试者”)进行了实证研究。研究者每天会让受试者试图说出屏幕上显示的 260-480 个句子,同时记录他们大脑左半球的四个皮质内微电极阵列的尖峰活动,通过这种方式对循环神经网络(RNN)进行训练。

  最终,经过训练的语音 BCI 可以使有语言障碍的人以每分钟高达 62 个单词的速度进行交流,比之前最先进的语音 BCI 输出速度快了 3.4 倍。除此之外,研究者还通过改进语言模型以进一步降低单词识别的错误率。该团队指出,通过改进语言模型和解码算法,将有可能继续提升其性能。

  该研究的通讯作者,来自斯坦福大学的电气工程教授、神经生物学和神经外科教授 Krishna Shenoy 已带领其团队在神经修复学领域深耕数十年。早在 2019 年,他与同事们成功让一位志愿者使用思想“说话”,并且达到了每分钟 18 个单词的速度,在当时引发了广泛关注。

  现在,得益于加州大学旧金山分校教授 Edward F. Chang 的研究,通过脑机接口“说话”的速度和语音识别准确度被进一步提高。Edward F. Chang 此前介绍,演讲中包括了人们所能做的最复杂的一部分动作。“该过程中,空气被推出并且发生振动,人们会同时使用嘴、嘴唇和舌头从而朗读文字。”

  “这些都是非常微小、微妙的动作,”来自加州大学旧金山分校的生理学教授 Philip Sabes 对此表示。尽管他并未参与该项目,但他认为,该项研究的一个重大进展在于,仅依靠少量神经元活动即可获知足够的信息,可以让计算机程序非常准确地预测患者试图说出的词语。

  进一步而言,斯坦福大学的研究团队强调,单次读取的神经元活动越多,其系统在理解受试者试图表达的内容时所犯的错误就越少。这一进展或将给 BCI 领域指明了一条切实可行的方向——使用更复杂的脑内植入物和与人工智能结合,从而提升脑内信息识别能力的准确性。

  “这很重要,因为该结果说明,对于那些十分复杂的处理任务而言,类似于 Neuralink 这样计划将 1,000 个电极放入大脑的想法就会带来切实的影响。”Sabes 对此评价道。

  这并不是一个不切实际的愿望。目前,包括 Neuralink 和 Paradromics 等在内的脑机接口公司已经表示,正在开发更先进的接口设备,可以同时记录数千甚至数万个神经元。

  Sabes 乐观地认为,实验性的大脑读取技术或将很快走出实验室,并且落地成为能够使用的产品。在其看来,“该研究中 BCI 的表现已经达到了多数相关患者需要的水平。”

  “当前结果展示了一条切实可行的研究道路,可以使用皮质内语音 BCI 恢复那些语言障碍患者的沟通能力。”来自斯坦福大学的研究者也介绍道,该项研究中 BCI 语音识别技术首次超过了现有其它技术的输出速度,例如眼动追踪或基于键盘的方法等。不过,他们同样表示,当前的语音 BCI 系统仍需要改进。

  其中一个问题在于单词的识别错误率。目前,该系统的单词错误率已从 23.8% 降低到了 17.4%,不过研究者认为“它还不是一个完整的、临床上可行的系统”。

  相关业内人士同样指出,“多年的研究表明,保持 BCI 系统具备稳定、可靠的性能是最为重要的问题之一。”近年以来,随着芯片技术和测量技术的快速进展和大量资源进入,脑机接口领域内的众多公司得到了长足发展。例如,Blackrock Neurotech 有望明年将其 BCI 系统推向市场;2021 年 7 月,FDA 批准脑机接口公司 Synchron 旗下植入血管内部的脑机接口设备 Stentrode 的临床试验申请;埃隆·马斯克也声称将在 2023 年内开展脑机接口的临床试验。对此,该评论人士认为,如果不能证实系统的长期稳定性或其准确性在不断下降,任何准备商业化的大脑植入物都可能在审批过程中“夭折”。

相关文章

脑机接口产品第三方评测工作正式启动

据脑机接口产业联盟消息,脑机接口产品第三方评测工作正式启动,目前脑机接口技术已经广泛应用到医疗、教育、康养、安全生产、娱乐等场景,产业正处于快速发展阶段。然而脑机接口技术仍面临在不同应用场景下如何与其......

脑机接口“连接”产业新空间

科技感满满的假肢不是装饰,而是能握拳、抓取,甚至持笔写字、握拍打球;仅靠“意念”就能驱动机械臂拿取东西,甚至操作电脑输入信息;穿戴式的设备记录脑电波的波动,将大脑的运转情况以数值形式反馈……众多科幻电......

脑机接口“解冻”渐冻症患者控制能力

发表在最新一期《科学进展》上的一项研究结果显示,美国约翰斯·霍普金斯大学开发出一种治疗渐冻症(ALS)的脑机接口(BCI),其能在3个月内保持90%的准确率,且无需重新训练或重新校准算法。ALS是一种......

马斯克又有大动作?!他的马斯克脑机接口Neuralink到底是发疯还是天才构想

天才向左,疯子向右。马斯克是最能表现这句话的意思的人。他不仅是一位成功的商人,他还关注生命、宇宙和人类的未来。他所有的目标都过于“宏大”,也略显“疯狂”。他缔造特斯拉来解决能源问题,引领全球进入电动汽......

马斯克的大动作!马斯克脑机接口公司将进行首次人体试验

马斯克的脑机接口初创公司Neuralink周二宣布,该公司已获得一个独立审查委员会的批准,将进行首次人体试验,对瘫痪患者的大脑植入设备。据Neuralink声称,这项人体试验为期六年,参与者将首先参加......

Neuralink公司首次脑机接口人体试验将来临安全隐患引关注

脑机接口指的是不依赖大脑的正常输出通路就可以实现人脑与外界直接通信的系统。自1973年雅克·维达尔提出脑机接口的概念与设想以来,各国科学家积极投入脑机接口的相关研究,在他们的努力下,脑机接口的概念范畴......

脑机接口让瘫患者“开口说话”

实验室里,67岁的PatBennett正在尝试使用包含125000个单词的大词汇集和包含50个单词的小词汇集说出短语,训练深度学习算法识别她大脑中的独特信号,以解码单词。对Bennett来说,这项研究......

《自然》刊登脑机接口技术重大进展:“读心”速度和准确性前所未有

随着全球有关脑机接口的研究迅速往前推进,瘫痪人群凭借“读心术”技术恢复沟通能力可能只是时间问题。根据国际著名学术期刊《自然》最新发表的两篇论文,科学家们开发出了新的脑机接口装置(BCI),能够以比以前......

国际研发新脑机接口装置帮助瘫痪人群恢复沟通能力

国际著名学术期刊《自然》最新发表两篇论文神经科学论文,研究人员报告研发出新的脑机接口装置(BCI),能够比现有技术更迅速、更准确且覆盖更大词汇量地将大脑活动解码为语言。该研究结果展示旨在帮助严重瘫痪人......

脑机接口新技术能给人们生活带来哪些惊喜?

进入2023年,脑机接口新技术备受关注,学界密集披露研究进展,业界忙着融资、产业化。今年5月底,工信部宣布,将把脑机接口作为培育未来产业发展的重要方向,加强脑机接口应用场景探索,加速推动脑机接口产业发......