计算机芯片的历史是一个极度微型化的激动人心的故事。

越小越好是我们所知的数字世界诞生的趋势。那么,你究竟为什么要逆转这一进程,把芯片做得更大呢?嗯,虽然没有特别好的理由使用iPad大小的芯片在iPad上,这样的芯片可能会被证明具有更特殊的用途,比如人工智能或模拟现实世界。

至少,这是世界上最大的计算机芯片制造商Cerebras所希望的。

大脑晶片大小的引擎无论如何都是巨大的。该芯片每边8.5英寸,容纳1.2万亿个晶体管。的第二大芯片在美国,英伟达(NVIDIA)的A100图形处理器每边一英寸,只有540亿个晶体管。前者是新的,大部分未经测试,到目前为止,是独一无二的。后者很受欢迎,大量生产,并在过去十年接管了人工智能和超级计算的世界。

那么歌利亚能改写大卫的剧本吗?Cerebras的任务就是找出答案。

超越人工智能的大筹码

大脑最初是隐形的去年,该公司表示,它可以显著加快深度学习模型的训练。

从那以后,WSE已经进入了几个超级计算机实验室,公司的客户正在那里测试它的性能。其中一个实验室——国家能源技术实验室(National Energy Technology Laboratory)正在研究它在人工智能之外还能做些什么。

因此,在最近的一次试验中,研究人员将这种芯片与一台流体动力学模拟的超级计算机进行了对比。模拟流体运动是一种常见的超级计算机应用程序,用于解决复杂的问题,如天气预报和飞机机翼设计。

该试验在a预印纸由Cerebras的Michael James和NETL的Dirk Van Essendelft领导的团队撰写,并在超级计算机会议上发表SC20这个星期。研究小组表示,CS-1完成发电厂燃烧模拟的速度比焦耳2.0超级计算机完成类似任务的速度快约200倍。

CS-1的速度比实时还要快。作为Cerebrus在一篇博文中写道,“它可以告诉你未来会发生什么,比物理定律产生同样结果的速度还要快。”

研究人员表示,CS-1的性能是任何数量的cpu和gpu都无法比拟的。首席执行官兼联合创始人安德鲁·费尔德曼告诉VentureBeat无论超级计算机有多大,这都是正确的。“在某种程度上,像焦耳这样的超级计算机无法在这类问题上产生更好的结果。这就是为什么焦耳模拟速度达到峰值它的核数为16,384个,只占其总核数86,400个的一小部分。

一个这两台机器的比较把这一点讲清楚。焦耳是81最快超级计算机在世界上,占据数十个服务器机架,消耗高达450千瓦的电力,并需要数千万美元来建设。相比之下,CS-1只占服务器机架的三分之一,耗电20千瓦,售价几百万美元。

虽然这个任务是小范围的(但很有用),而且这个问题很适合CS-1,但它仍然是一个非常惊人的结果。那他们是怎么做到的?一切都在设计中。

减少上下班

计算机芯片的生命开始于一大块叫做晶圆片的硅片上。多个晶片被蚀刻在同一晶片上,然后晶片被切割成单独的晶片。虽然硅晶圆片也蚀刻在硅晶圆片上,晶圆片作为一个单独的操作单元是完整的。这个晶圆级芯片包含近40万个处理核。每个核都连接到它自己的专用内存和它的四个相邻的核。

把这么多核放在一个芯片上,并给它们自己的内存是WSE更大的原因;这也是为什么,在这种情况下,它更好。

大多数大规模计算任务都依赖于大规模并行处理。研究人员将这项任务分配给成百上千个芯片。这些芯片需要协同工作,因此它们处于持续的通信中,来回传递信息。类似的过程发生在每个芯片上,信息在执行计算的处理器核心之间移动,并共享内存来存储结果。

这是一个就像一家旧时的公司,把所有的业务都写在纸上。

该公司使用快递员从城市的其他分支机构和档案馆发送和收集文件。快递员知道通过城市的最佳路线,但旅行需要的时间最少,这取决于分支机构和档案馆之间的距离,快递员的最高速度,以及有多少其他快递员在路上。简而言之,距离和车流使事物减速。

现在,想象一下这家公司建造了一座崭新的、闪闪发光的摩天大楼。每个分支机构都搬进了新大楼,每个员工在他们的办公室里都有一个小文件柜来存储文件。现在,他们需要的任何文件都可以在穿过办公室或穿过走廊到邻居办公室的时间内存储和检索。信息通勤几乎已经消失。所有东西都在同一个房子里。

Cerebras的megachip有点像那栋摩天大楼。它传输信息的方式——通过特别定制的编译软件进一步辅助——比需要大量传统芯片联网的传统超级计算机要高效得多。

模拟世界的发展

值得注意的是,该芯片只能处理小到可以装在晶圆上的问题。但这些问题可能会有相当实际的应用,因为机器能够实时进行高保真模拟。作者指出,例如,从理论上讲,这台机器应该能够精确地模拟试图降落在飞行甲板上的直升机周围的气流,并半自动化这一过程——这在传统芯片上是不可能实现的。

他们指出,另一个机会是使用模拟作为输入来训练同样驻留在芯片上的神经网络。在一个有趣且相关的例子中,最近加州理工学院的机器学习技术被证明要快1000倍用同样的偏微分方程来模拟流体动力学。

他们还指出,芯片的改进(以及其他类似的改进,如果有的话)将会突破其所能达到的极限。大脑已经宣布发布下一代芯片它将拥有2.6万亿晶体管,85000个核,以及超过两倍的内存。

当然,这还有待观察晶圆级计算真的腾飞了。这个想法已经存在了几十年,但brains是第一个认真研究它的人。显然,他们相信他们已经用一种有用和经济的方式解决了问题。

其他新的架构也正在实验室中进行研究。Memristor-based神经形态芯片例如,通过把处理和记忆放进大脑来模拟大脑个人transistor-like组件。当然,量子计算机是在单独的车道上,但处理类似的问题。

这些技术中可能会有一种最终崛起,统治所有这些技术。或者,这看起来很有可能,计算可能分裂成一个奇异的由激进芯片组成的被子,所有的芯片都缝合在一起,根据情况充分利用每一个芯片。

图片来源:大脑

杰森是奇点中心的执行编辑。188金宝搏app1.1.94在进入科技领域之前,他做过有关金融和经济的研究和写作。他对几乎所有的事情都很好奇,遗憾的是他只知道其中的一小部分。