在我们的生活中,我们与科技互动的方式正变得越来越无缝。如果在手机里输入术语或地址还不够简单,现在你可以让Siri帮你搜索或调出方向。不想从沙发上起来按一下开关,或者想在你把车开进车道时屋子里灯火通明?告诉你的Echo家庭助理你想要什么,然后把灯打开。

工程师们一直在研究各种类型的脑机接口,以进一步实现这种无缝连接,无论是通过测量大脑的活动视觉皮层重建图像,或训练一种算法为瘫痪病人“说话”基于他们的大脑激活模式

上周在计算机协会的ACM上智能用户界面会议在东京,来自麻省理工学院媒体实验室推出了AlterEgo这是一种可穿戴式界面,可以“读出”用户正在思考的文字——用户无需大声说出任何东西。

如果你认为谷歌玻璃看起来很笨拙,但AlterEgo也没那么圆滑;这种技术包括一条白色塑料带,钩在耳朵上,延伸到下巴下方,另外还有一个附件放在佩戴者的嘴下。当使用者在脑海中默念某个单词时,大脑就会释放出神经肌肉信号。然后,一个机器学习系统解读这些信号,并识别出用户脑子里想的是什么词——令人惊讶的是,它的准确率达到了92%。

Arnav Kapur,一个研究生了他我的发展他说:“这样做的动机是为了制造一个内部情报装置——一种智能增强装置。我们的想法是:我们是否可以有一个更内部的计算平台,在某些方面融合人与机器,感觉就像我们自身认知的内部延伸?”

不全是你的想象

谁知道当你思考的时候,你的脸会有特别的肌肉运动?这不是很有趣吗,除了你,没人能知道你在想什么?

事实证明,我们有一个为肢体语言做准备的系统;即使我们不大声说什么,它也是活跃的,准备工作一直延伸到我们的肌肉,它会释放肌电的信号基于他们认为我们要说的话。

找出哪些地区我们的脸发出最强的神经肌肉信号相关的演讲中,麻省理工学院的团队测试对象认为,默默地说(也称为“默读”)序列四次的单词,和一群16个电极放置在每次课程的不同部分的脸。

对结果数据的分析表明,来自七个特定电极位置的信号最能解读默读单词。研究小组将数据输入神经网络,神经网络能够识别特定单词和AlterEgo接收到的信号之间的模式。

尽在不言中

到目前为止,该系统的能力仅限于相当直接的单词;研究人员使用简单的数学问题和象棋走法来收集初始数据,用户的词汇范围被限制在大约20个可能的单词。所以,虽然它的概念证明非常惊人,但在它能够理解你所有的想法之前,AlterEgo还有很长的路要走。不过,这项技术的开发人员的目标是扩展其功能,他们未来的工作将专注于为更复杂的单词和对话收集数据。

它是什么?

虽然像AlterEgo这样的技术可以给我们的生活带来方便,但我们应该停下来问问自己,为了方便而不是需要,我们愿意允许多少干扰。比如说,为了买到最划算的东西,还是为了节省最多的时间,我是否需要用电极读取我的想法?或者我能看一下价签然后走快点吗?

在讨论这项技术的实用性时,麻省理工学院(MIT)媒体艺术与科学教授、卡普尔的论文导师帕蒂·梅斯(Pattie Maes)提到了在谈话中不得不拿出手机查东西的不便。她说:“我和我的学生一直在试验新的形式因素和新的体验,使人们仍然受益于这些设备给我们提供的所有精彩的知识和服务,但以一种让他们留在现在的方式来做。”

萨德Starner是佐治亚理工学院计算机学院的教授。他没有参与AlterEgo的创造,但他在可穿戴技术方面做了大量工作,并与谷歌Glass密切相关。Starner有一些想法对他我更功利主义的应用,指出在高噪音环境中,如机场的停机坪上,一艘航空母舰的飞行甲板上,或在电厂或印刷机,系统将“伟大与语音沟通的环境中,你通常不能。”

斯特尔纳补充说:“这是一个有意义的系统,特别是因为通常在这些类型或情况下,人们已经穿戴了防护装备。例如,如果你是一名战斗机飞行员,或者是一名消防员,你已经戴上了这些面具。”他还提到,这项技术将对特殊行动和残疾人有用。

对AlterEgo这样的无声音界面进行研究,以达到这些实际目的,可能会增加对该技术的支持,同时消除人们的恐惧奥威尔式的读心术侵犯精神隐私.随着该领域的进步,这个话题将在工程师们的头脑中变得越来越响亮。

图片来源:罗莉·勒琼/麻省理工学院