深度强化学习正迎来超级明星时刻。

供电更智能的机器人。模拟人类神经网络。在医疗诊断和粉碎人类最好的游戏玩家,令人震惊的医生雅达利。虽然远非实现人类自然而然的灵活性,快速思维,但这种强大的机器学习的想法似乎是不可阻挡的,作为更好的思维机器的预兆。

除了有一个大规模的障碍:他们永远跑步。由于这些算法背后的概念是基于试验和错误,因此在获得正确决策的奖励之后,加强学习AI“代理”只学习。对于复杂的问题,AI代理需要尝试并无法学习解决方案所需的时间可以快速变得无法理解。

但是,如果您可以同时尝试多个解决方案呢?

本周,维也纳大学菲利普瓦尔特博士领导的国际合作采取了加固学习的“经典”概念,并给予了量子旋转。他们设计了一种混合AI依赖于量子和研磨的经典计算,并显示 - 由于Quantum Quirkiness - 它可以同时筛选少数不同的方式来解决问题。

结果是一款强化学习AI,它学习超过60%的速度比其非量子化的对等体快60%。作者解释说,这是第一次显示添加量子计算可以加速AI代理的实际学习过程的测试之一。

尽管在研究中只遇到了一个“玩具问题”,但这种混合人工智能一旦规模化,就可能影响到现实世界中的问题,比如构建高效的量子互联网。作者写道,这种装置“很容易集成到未来的大规模量子通信网络中”。

瓶颈

从尝试和错误中学习是我们大脑的直觉。

假设您试图在没有地图的情况下导航新的复杂的露营地。目标是从公共浴室返回营地。死胡同,令人困惑的循环比比皆是。我们通过决定在路上的每个分支左转或右转来解决问题。一个人会让我们更接近目标;另一个导致半小时的行走在圈子里。最终,我们的大脑化学奖励正确的决定,所以我们逐步学习正确的路线。(如果你想知道......是的,真实的故事。)

强化学习人工智能也采用类似的试错方法。随着问题变得越来越复杂,每次试验的次数和时间也会飙升。

“即使是在一个比较现实的环境中,对一个给定的情况做出理性的反应可能也需要很长时间,”解释研究作者Hans Briegel博士在奥地利的Innsbruck inUniversität因斯布鲁克,他们以前努力加快使用量子力学的AI决策。如果有压力允许“只有一定时间响应,那么代理人可能无法应对这种情况并全部学习,”他写道。

许多人尝试加速强化学习。给人工智能代理人a短期的“记忆”。分为神经形态计算,这更好地类似于大脑。2014年,布里格尔和同事显示某种“量子大脑”可以帮助推动人工智能智能体在学习后的决策过程。但是,加快学习过程本身,我们却没有尽最大的努力。

混合人工智能

这项新的研究直行为此以前取得的颈牙。

团队的主要洞察力是挖掘世界上最好的繁殖和古典计算。他们没有使用量子力学建立一个完整的强化学习系统,而是转向了一种可能被证明更实用的混合方法。在这里,人工智能使用量子怪异来尝试新的方法——反复试验中的“试验”。然后,系统将指挥棒传递给经典计算机,根据AI的表现给予奖励或不给予奖励。

量子“试验”过程的核心是一种被称为叠加的怪癖。和我呆在一起。我们的计算机是由电子驱动的,电子只能表示两种状态- 0或1。量子力学要奇怪得多,因为光子(光的粒子)可以同时是0和1,“偏向”其中一个或另一个的概率略有不同。

这种非宣传奇怪是使量子计算如此强大的一部分。采取我们的强化学习示例,用于导航新露营地。在我们的经典世界中,我们和我们的AI - 需要在交叉路口左右转弯之间。然而,在量子设置中,AI可以(从某种意义上)左右左转同时。因此,在搜索返回主基地的正确路径时,Quantum系统的腿部可以同时探索多条路线,使其比传统,连续的路径和错误更快。

“因此,可以探索其卓越环境的代理人将比经典的对方更快地学到明显,”Briegel。

这并不全是理论。为了验证他们的想法,该团队使用了一种名为a的可编程芯片纳米光电影处理器。将其视为一种类似CPU的计算机芯片,但它处理光光子的粒子而不是电力。这些光源芯片在制作中已经很久了。例如,回到2017年,来自麻省理工学院的团队在光学芯片中构建了一个全光学神经网络,以支持深度学习。

薯条也不全是异国风味。纳米光子处理器的作用有点像我们的眼镜,它可以进行复杂的计算,转换穿过它的光。在眼镜盒里,它们让人们看得更清楚。对于基于光的计算机芯片,它允许计算。这种芯片不是使用电缆,而是使用“波导”来穿梭光子,并根据它们的相互作用进行计算。

新硬件的“错误”或“奖励”部分来自于一台经典计算机。纳米光子处理器与传统计算机相结合,后者为量子电路提供反馈——也就是说,是否奖励一个解决方案。研究小组解释说,这种设置使他们能够更客观地实时判断学习速度。

通过这种方式,混合强化学习代理在量子和经典计算之间交替,在获得接地的经典物理“正常性”的反馈时尝试在诙谐的“多层”陆地上的想法。

一个量子增加

在使用10000个人工智能代理和165次试验的实际实验数据进行的模拟中,当面临更复杂的问题时,这种混合方法显示出了明显的优势。

关键词是“复杂”。研究小组发现,如果一个人工智能智能体有很高的机会找到解决方案——就像解决一个简单的问题一样——那么经典计算就能很好地发挥作用。当任务变得更加复杂或困难时,量子力学的优势就会开花结果,让量子力学充分发挥其叠加作用。对于这些问题,与传统的强化学习相比,混合人工智能学习解决方案的速度快了63%,学习工作量从270次猜测减少到100次。

现在,科学家们已经向加强学习速度提升了量子提升,下一代计算的比赛更加亮起。远程光线通信所需的光子仪硬件正在快速缩小,同时提高信号质量。作者写道,部分 - Quantum设置可以“特别努力在需要频繁搜索的问题中频繁搜索,这是一个普遍的网络路由问题”。通过量子提升,加强学习可能能够解决更复杂的问题 - 真实世界中的问题 - 而不是目前可能的问题。

“我们刚刚开始了解量子人工智能的可能性,”第一作者沃尔特说。

图片来源:Oleg Gamulinskiy.Pixabay

范雪来是一位神经科学家出身的科学作家。她在不列颠哥伦比亚大学(University of British Columbia)完成了神经科学博士学位,在那里她开发了神经退化的新疗法。在研究生物大脑时,她开始对人工智能和所有生物技术着迷。毕业后,她搬到了加州大学旧金山分校,研究以血液为基础的因素,使衰老的大脑恢复活力。她是……

遵循搁置: