中文 英语

服务器变得更加异构化

今天的服务器有一两个x86芯片,或者Arm处理器。在5年或10年里,他们将有更多的特色。

受欢迎程度

服务器中的cpu数量在增加,制造这些处理器的供应商的数量也在增加。

CPU Server Build已成为一个,二,四,且偶尔的更多X86处理器,具有IBM的Power和Z系列作为主要例外。虽然X86处理器不一定被替换,但它们正在与新的处理器设计进行协调并增强各种更专业的任务。

在最近的超级计算机500强榜单中,有140台超级计算机拥有英伟达的GPU协同处理器,而且这个数字只会继续增长。在未来5到10年,通用服务器将配备x86处理器、gpu、fpga、Arm内核、AI协同处理器、5G调制解调器和网络加速器。

这是识别出在应用程序处理时,一个尺寸不适合所有尺寸。终端市场是碎片,所有这些都要求定制解决方案。结果,计算的未来 - 特别是在服务器端 - 是异构的。

TECHnalysis Research总裁兼首席分析师Bob O 'Donnell表示:“人们发现,不同的芯片架构更适合不同类型的工作负载。”“由于工作负载的多样化将继续,对多样化计算的需求也将继续。还会有其他必要的筹码。这并不意味着cpu将会消失,但其他类型的芯片将会有更多的变化。然后最大的问题将是包装的互联性。”

英特尔对其XPU项目进行了激进的立场,它将CPU,GPU(通过其新XE GPU),FPGA从Altera和AI处理器组合起来,API与API统一。“数据中心XPU产品和解决方案总经理Jeff McVeigh说:”我不认为这将是一个答案。“英特尔。“但是将有很多范围,从密切地集成了整合到系统级连接的多芯片封装。”

对不同的计算架构的需求由新数据类型驱动,争论NVIDIA的企业计算负责人Manuvir Das。“每个公司都有越来越多的数据。公司愿意收集越来越多的数据。而且原因是因为他们现在可以看到他们可以从他们的数据中获得价值。“

半导体行业目睹了相当大的并购活动最近几个月,随着企业通过收购而非自然增长来实现产品多样化。

  • 多年来从未进行过大规模收购的英伟达(Nvidia)突然打开支票簿,以70亿美元收购SmartNIC制造商Mellanox,以400亿美元收购ARM Holdings。
  • AMD提出以350亿美元收购Xilinx,这是其多年来首次重大收购行动。
  • Marvell Technology以60亿美元收购了Arm服务器芯片制造商Cavium,以100亿美元收购了网络半导体制造商Inphi。
  • ADI公司已签署协议,以获得210亿美元的价格获得Maxim集成产品。

奥唐纳说:“他们正在多元化,因为他们都认识到他们必须有各种不同的芯片架构。”“困难的部分将是做英特尔试图用一个API做的事情,也就是,‘我如何把这些不同的架构,让人们可以使用它们?每种架构都需要不同的指令集、不同的编程方式、不同类型的编译器等等。”

一个芯片还是多个?
那么问题就变成了主板上会有一块大的硅,还是每个芯片组有多个插座?这并不是什么新想法。片上系统已经存在多年了。但soc正在发生变化。

SoC设计通常会削减处理器,特别是GPU,以使所有这些芯片都适合合理的热保护层。一个单独拥有完整CPU、GPU和FPGA的SoC将拥有约700瓦的TDP,这对任何人来说都是完全没有吸引力的。如果要进行封装设计,很可能是缩小处理器的规模。

“AMD在业界做了一些伟大的工作来证明这一点小芯片封装是可能的CPU核心和I/O芯片。如果你想要一个更强大的东西,你可能建立整个chiplets,只是,你知道,一个可能是CPU核心,一个是多个神经网络引擎,也许一个是GPU,你可以把它们放在一起在同一个包,”副总裁Steven Woo表示系统和解决方案和杰出的发明家兰姆斯

英特尔的麦克维对多封装设计持开放态度,作为一种选择。“就内存带宽而言,做单一的封装设计显然有好处,但也有限制,你可以在任何封装中塞入多少。所以我不认为未来会有一个单一的答案。但将有多种选择,从紧密集成、单片集成到多芯片集成,再到系统级连接。

NVIDIA也对多芯片包装的想法开放,虽然它的愿景就像英特尔一样。它提供了所有硅。DAS指出,NVIDIA已经具有Tegra形式的ARM / GeForce SoC,以及将Mellanox ConnectX-6网络控制器与ARM CPU和AMPERE GPU组合的新的Bluefield 2系列数据处理单元(DPU)。在NVIDIA的路线图中,2022年的Bluefield 4将在单件芯片上具有所有三个CPU。

“如果你只考虑从现在起3年或5年的计算量,如果你不这样做,世界将无法承受。所以会有多种形式因素。当你接近边缘时,它看起来会更倾向于综合解决方案,”Das说。

但这是英特尔和英伟达将自己所有的IP整合到一块硅片上。当两家或两家以上的公司——例如Marvell和AMD——合作的前景令人怀疑。

“这将会很困难,”Supermicro负责FAE和业务发展的高级副总裁Vik Malyala说。“为什么英特尔或AMD要向英伟达开放其处理器架构的一切?”英伟达也是如此。为什么Nvidia要公开所有与他们的GPU相关的东西来与别人合作?他们试图收购Arm是有原因的。”

艾迪·拉米雷斯,基础设施事业部高级营销总监手臂他说,多厂商芯片是有先例的。“如果你回顾10年前,我们几乎还处于将设计与生产分离的婴儿期。对于现在的soc来说,这是很平常的。所以在你所说的时间框架内,在5到10年内,这个生态系统将发展到你可以使用来自不同供应商的硅制造FCM。”他说。

然而,鉴于不同的芯片有不同的寿命,他质疑这是否是个好主意。“有一台带有PCI卡的服务器是一回事,你可以更换卡。但当它们在一个包里时,你必须立刻替换所有东西。这适用于不同的生命周期吗?这才是有趣的地方,”他补充道。

Malyala还指出,芯片供应商有多个芯片用于不同的性能场景,并将束放入一个包限制客户选择。“例如,如果我是Xilinx,我有十几个不同的FPGA。但是,如果我把一个放在一块特定的硅中,我说这正是它将是怎样的,而且我遇到了困难的,即使我过度行进或欠下了,“他说。

CXL方程
服务器中的非CPU处理器的当前修复是PCI Express卡。GPU,SSD,FPGA和其他协处理器占用了一个作为PCIe插槽,只有这么多的空间用于卡片,尤其是超薄1U和2U设计。

PCIe还限制了是点对点通信协议。这计算表达链接(CXL)协议作为PCIe的替代协议正在迅速获得接受,因为它与PCIe以及可替代的自动协商交易协议一起工作。

“在我们进入这些更复杂的架构中,我们真正需要的是,可以支持同行对等通信的各种拓扑,这是缩放那样的能力,”McVeigh说。“PCI表达本身不会回答所有这些问题。但对于你想要能够的情况,显然从现有的设计升级,你有单独的卡片,也许不需要在全面的互连,它在那里确实很好。“

这是对CXL它通过快速连接将加速器放在离处理器更近的地方,更重要的是,它使内存连接到系统内存的加速器部分,而不是私有的设备内存。这减少了系统内存的负载,减少了需要移动的数据量,因为设备内存(比如GPU)中的数据很容易可见,而无需在系统内存之间来回移动。

无论多个处理器是否在单芯片上或多个模具上,它们都必须以某种方式绑在一起,并且CXL被视为网格以绑定它们。PCIe有其用途,但它是一个点对点协议,而不是CXL等网格。此外,CXL允许处理器共享内存,PCIe无法做到。

“CXL绝对是非常可靠的,”Rambus ' Woo说。“如果这个行业真的围绕着它聚集起来,这将成为一种新型互联发展的垫脚石,我们将围绕节点彼此之间的连接进行优化。然后可能将处理器连接到内存和分解场景,甚至可能将处理器连接到gpu和存储。”

CXL进入的一个例子是具有在与PCIe的不同端点之间具有相干存储器访问的概念,所述Ramirez表示。如果您正在尝试在一个加速器上执行一定数量的计算,并且需要与其他加速器交谈,他们应该能够直接发言而不是使用一部分的轮毂和辐条模型。一切都必须转到一个点协调。“PCI Express并不固有地具有这种功能,”Ramirez说。

有可能一种全新的标准将与它的基础在PCIe的好部分,不需要的部分演变。Woo指出,当两个PCI Express设备第一次开始相互交谈时,它们使用PCIe Gen 1进行协商,然后逐步过渡到连续几代,直到它们找到可以交谈的最高速度。

“整个初始化序列有点麻烦,”Woo说。“如果你从硅设计师的角度来考虑,你会说,‘等一下,我必须把所有栅极都装进去,他们会习惯了,只知道我能说得更快——我不会再使用那些晶体管了。“有这种简单的协议是一种美。作为一名硅设计师,我宁愿把这些门用于其他用途。”

一个API统治它们
没有软件的硬件只是一堆金属,所以这些努力背后的真正问题就是他们将如何聚集在一起。英特尔拥有其ONEAPI计划最完整的解决方案。ONEAPI为计算和数据密集型域提供库,例如深度学习,科学计算,视频分析和媒体处理。

ONEAPI与用C,C ++,Fortran和Python编写的代码互操作,以及MPI和OpenMP等标准。它还拥有一组编译器,性能库,分析和调试工具,以及兼容在CUDA中迁移到数据并行C ++(DPC ++)的迁移代码的兼容性工具,包括在C ++和KhronoS Sycl上构建的开放式跨架构语言标准。

dpc++扩展了这些标准,并提供了显式的并行构造和卸载接口,以支持一系列计算架构和处理器。当然,它支持英特尔,但麦克维说,他希望其他芯片公司也能采用它。

“我们将其视为一种行业倡议 - 将这些异构架构与统一的编程模型相结合,”McVeigh表示。“我们已经使用它作为真正绑定这些架构的关键元素,因此您可以使用通用语言进行编程方式,这是一个与OS供应商解决方案一起使用的通用库,不仅是英特尔产品的常用库。”

O'Donnell相信软件解决方案将遇到董事会,从BIOS和驾驶员供应商到Linux Distor,如Red Hat Enterprise Linux和Ubuntu从Canonical。“这是一个这样的多层堆栈,”他说。“就像现在一样,它在董事会上。我不认为你会看到一个解决方案。涉及太多的碎片。“

结论
服务器行业需要更多的证据来证明异构计算的有效性。但这不是寻找市场的解决方案。许多市场存在,新的市场正在开发与推出的边缘。改变的是,解决方案是为他们量身定制的,而不是终端市场适应现有的最好的现成技术。

“概念上,它只是有意义的是,我们将需要不同的芯片架构,”O'Donnell说。“我们需要一个单一的软件平台来利用它们,但它需要在通过这个硬件抽象层和其他一切来源地致神奇地这样做。”

当人们开始使用多芯片架构时,我们是否会开始看到它以他们期望的方式工作?我们是否获得了人们期望的性能好处?它的成本效益如何?这在现实世界中是如何运作的呢?

“除了理论之外,还有什么有待观察,”他说。“我们将在多个层面上看到这一点。英特尔(Intel)将推动它,但你也会看到其他公司试图推动它。”

相关的
新的架构,更快的芯片
大量的创新推动了性能上的数量级的改进。
数据中心数据过载
哪种架构和接口最适合不同的应用程序。
2020年的顶级科技视频
2020年的工程师正在观看哪位工程师。



1评论

Jayn 说:

您是否看到了CPU与CXL从功能的讨论。这将使偏置一致性和增加数量的CPU协同处理器的可能性,而没有对称的一致性开销和套接字限制。

留下一个回复


(注意:此名称将被公开显示)