来源: 新浪网 作者: 药明康德 2018-11-20
Ashesh Mehta博士是纽约长岛的芬斯坦医学研究所(Feinstein Institute
for Medical Research)的脑外科医生。今天他和往常一样对他的癫痫患者进行手术,寻找癫痫发作的源头。不过这一次,他的患者同意加入一项大胆的科学实验,这一实验的最终目的是将无声的思想转化为有声的语言。
在打开患者颅骨,暴露大脑之后,Mehta博士小心翼翼地将一片微电极矩阵贴在了患者大脑左侧,那些与倾听和产生言语相关的脑区。通过纪录这一脑区的电生理活动,并且将这些信号通过无线传递给计算机进行解码,这些微电极和系统的其余部分可能成为第一个处理语言信息的“大脑计算机界面”(BCI)。
经过BCI系统处理播放出的语言可读性达到了75%,这与以前的语言BCI刚刚过半的可读性相比是非常大的进步。如果将所有的神经反应综合分析,会进一步提高重建语言的准确率,在微电极矩阵中添加更多的电极也能够提高重建语言的准确率。人类的大脑对想象和现实之间的区分不是那么明确,当大脑想象一件事时,神经活动的特征跟真正做这件事时的神经活动极为相似。
这类系统最主要的挑战是,解读大脑想说的一个词需要分析更多的信号,而且与语言相关的脑区还没有被精确确认,语言的编码分散在一个广阔的大脑网络里,目前的记录技术还不能以足够高的时空分辨率,对整个大脑进行监控。
下一步,研究人员将检验这一人工智能系统解读大脑想象语言时产生的电活动的能力,如何将这些信号重建成为发声的语言是问题的瓶颈。利用人工智能改善解读电信号的能力,可以帮助我们构建一个从大脑神经活动中重塑准确和可读的语言的框架。
这项技术虽然最初的目的是帮助残障患者,但是它可能会普及到其它人,甚至有可能在健康人身上先得到应用。在2017年麻省理工学院召开的神经科技会议上,Facebook的Mark Chevillet博士描述了该公司对“从念头到打字”的BCI研究,这项研究的指导理念源于一个想法“如果你能够直接用大脑打字的话会是什么样子?”
这一项研究的目标是“开发一种无声的语言界面,让你能够以比打字快5倍的速度输出文字,大约每分钟100个词。”该公司在研究能否用非侵入性的方法来收集高质量的神经信号并且将它们正确解码成为音素。如果这一步能够成功,那么下一步是将这些信号输入到一个数据库中,将音素顺序与词语配对,然后使用软件预测这些信号最可能代表哪些词语。
|