这是人工智能研究一个时代的终结。几十年来,复杂的棋类游戏,如围棋、象棋和将木,一直被视为机器智能的主要标准。DeepMind的最新程序只要自己玩就能掌握这三种技能,这表明我们需要为人工智能设置更大的挑战。

1997年,IBM的“深蓝”(Deep Blue)击败了国际象棋大师加里·卡斯帕罗夫(Garry Kasparov),机器首次开始蚕食人类的智力主导地位。在这十年的前5年,日本棋类中难度更高的棋类将棋的大师们开始沉迷于电脑。2016年,DeepMind震惊了世界AlphaGo程序打败了世界顶尖的围棋大师之一,围棋被广泛认为是世界上最复杂的棋类游戏。

与所有这些壮举一样令人印象深刻的是,游戏AI通常利用单一游戏的属性,并经常依赖于开发者编写的手工知识。但DeepMind的最新发明AlphaZero,在一篇新论文中详细介绍科学,是自下而上构建的游戏不可知论者。

它所得到的只是每一款游戏的规则,然后它将自己玩上数千次,并有效地使用尝试和错误去制定每一款游戏的最佳策略。然后,它在每一场比赛中都与包括其前身AlphaGo在内的最强大的专业人工智能展开较量,全面击败了它们。

“这项工作实际上已经结束了人工智能研究数十年的新篇章。人工智能研究人员需要关注新一代的游戏,以提供下一套挑战,”IBM计算机科学家默里·坎贝尔在一份报告中写道的意见,科学

AlphaZero的通用性很重要。虽然学习掌握世界上最复杂的桌面游戏令人印象深刻,但它们严格控制的环境与现实世界相距甚远。的强化学习方法DeepMind在围棋、电子游戏和模拟器方面都取得了令人印象深刻的成果,但实际应用却很难获得。

通过使这些程序更通用,该公司希望他们可以开始突破这些更严格的环境的限制,并使用这种方法来应对现实世界的挑战。上周,有证据表明过渡可能已经开始——这是他们的算法之一赢得了预测蛋白质折叠方式的比赛这是一个复杂的问题,是许多生物过程的核心,或许更重要的是,是药物设计的核心。

这个新程序最令人印象深刻的特点之一是它在寻找理想动作时的效率。研究人员使用蒙特卡洛树搜索技术,这种技术长期以来一直是围棋机器的标准,但通常被认为不适用于国际象棋或象棋。

但这一转变使该项目能够专注于最有希望的潜在位置,而不是像对手那样采用暴力手段。在国际象棋和将军棋中,它每秒估计的潜在位置只有6万,相比之下,它的对手国际象棋每秒估计的位置是6000万,将军棋每秒估计的位置是2500万。

尽管如此,这三款游戏都是“完全信息游戏”,即每个玩家都能够清楚地看到游戏状态,而不像扑克等纸牌游戏,即玩家并不知道对手的手牌。现实世界中很少有完全的信息,因此在这些系统中建立处理不确定性的能力将是至关重要的下一步。

这使得人工智能研究人员对《星际争霸2》和《Dota 2》等多人电子游戏产生了兴趣。这些游戏都是开放式的,玩家只能看到有限的对手行动,并且需要长期战略规划。到目前为止,人工智能程序还没有打败它们的人类对手。

关于这项研究的最后一点值得注意的是,它包含了巨大的计算能力。AlphaZero只花了9个小时就掌握了国际象棋,12个小时就掌握了会棋,13天就掌握了围棋。但这是通过使用5000 tpu(谷歌专门的深度学习处理器)实现的。

这是一个巨大的计算能力,除了硅谷的巨头之外,几乎任何人都无法企及。作为纽约大学的计算机科学家朱利安Togelius指出《新科学家》,系统只是在其学习能力方面具有普遍性。接受过shogi训练的程序不能下国际象棋,所以每次你重新使用它时都需要使用如此庞大的计算资源。

这是一种趋势的一部分OpenAI研究人员指出今年早些时候,用于训练该领域一些最令人兴奋的进展背后的程序的计算资源正在呈指数级增长。这引起了人们的兴奋和关注。

一方面,它提出了这样一个问题:在许多问题的可处理性方面的一个重要因素是否仅仅是你可以为它们提供多少芯片。鉴于各公司似乎都愿意在人工智能领域投入大量资源,这意味着该领域前景光明。

但与此同时,它也指出了一个人工智能有与没有的未来。如果计算资源对该领域的发展越来越不可或缺,那么大型科技公司之外的许多聪明人士可能会被甩在后面。

图片来源:寒意Chillz/Shutterstock.com

我是印度班加罗尔的一名自由科技作家。我主要感兴趣的领域是工程、计算和生物学,特别关注这三者之间的交叉点。

遵循Edd: