阻碍机器人革命的最大障碍之一是它们无法适应环境。不过,这种情况可能即将改变,这要归功于一种新方法,它混合了预先学习的技能来应对新的挑战。

把机器人放在一个严格控制的环境中可以在复杂的任务中迅速超越人类,从制造汽车到乒乓球。但是给这些机器一个曲线球,它们就有麻烦了——看看这个编译一些世界上最先进的机器人在面对沙子、台阶和门口等众所周知的具有挑战性的障碍时能够自如自如。

机器人之所以如此脆弱,是因为控制它们的算法通常是人工设计的。如果他们遇到了设计师没有想到的情况(这在混乱的现实世界中几乎是不可避免的),那么他们就没有做出反应的工具。

人工智能的快速发展提供了一个潜在的解决方案,让机器人学会如何执行任务,而不是依赖手工编码的指令。一种特别有前途的方法是深度强化学习,机器人通过试错过程与环境交互,并因执行正确的行动而获得奖励。通过多次重复,它可以使用这种反馈来学习如何完成手头的任务。

但是这种方法需要大量的数据才能完成简单的任务。我们想让机器人做的大部分事情实际上是由许多更小的任务组成的——例如,送包裹需要学习如何拿起一个物体,如何行走,如何导航,以及如何将一个物体传递给其他人等等。

同时训练所有这些子任务是非常复杂和远远超出的最新的功能人工智能系统中,所以m任何迄今为止的实验都集中在狭隘的技能上。有些人尝试着分别训练AI的多种技能,然后使用一个整体系统在这些专家子系统之间切换,但这些方法仍然不能适应全新的挑战。

不过,在这项研究的基础上,科学家们现在已经创建了一种新的人工智能系统,可以将专家子系统融合在一起z一个特定的任务。在一个科学的机器人,他们解释这是如何允许四条腿的机器人可以即兴发挥新的技能,并实时适应陌生的挑战。

该技术被称为多专家学习体系结构(MELA),依赖于两阶段训练方法。第一个研究人员用计算机模拟训练两个神经网络来完成两项独立的任务:小跑和从跌倒中恢复。

然后,他们使用这两个网络学会的模型作为8个模型的种子其他神经网络行业性z更具体的运动技能,如翻身或左转或右转。这8个“专家网络”与一个“门控网络”同时接受训练,该网络学习如何将这些专家结合起来解决挑战。188体育365

由于门控网络综合了专家网络,而不是按顺序打开它们,MELA能够混合不同的专家,使其能够解决没有人能够单独解决的问题。188体育365

作者将这种方法比作培训人员如何踢足球。你先让他们做一些个人技能的训练,比如运球、传球或投篮。一旦他们掌握了这些技能,他们便能够巧妙地将这些技能结合在一起,以应对真正游戏中的更多动态情况。

在模拟训练算法之后,研究人员把它上传到一个四条腿的机器人上,并让它在室内和室外进行一系列测试。该机器人能够快速适应复杂的表面,如砾石或卵石,并能迅速从反复被推倒后恢复过来,然后继续前行。

要将这种方法应用于现实世界的商用机器人,还有很长的路要走。首先,MELA目前不能整合视觉感知或一个触觉;它只是依靠机器人关节的反馈来告诉它周围发生了什么。你要求机器人掌握的任务越多,训练就会越复杂和耗时。

尽管如此,新的方法指向了一个有希望的方法,使多技能机器人变得比的总和他们的部分虽然很有趣,但我似乎嘲笑笨拙的机器人汇编很快就会成为过去。

图片来源:Yang等人,科学机器人

我是一名自由科技作家,住在印度班加罗尔。我的主要兴趣领域是工程学、计算机和生物学,尤其关注这三者之间的交叉点。

遵循Edd: