中文 英语

RISC-V针对数据中心

随着生态系统的成熟,开源架构在更复杂的设计中获得了一些吸引力。

受欢迎程度

RISC-V供应商在计算层次结构中开始旨在更高,定位数据中心和超级计算机,而不是在边缘上的简单嵌入式应用程序。

在过去,这对于一个新的指令集体系结构来说几乎是不可能的。但是,对异构芯片集成的日益关注,加上规模扩张带来的好处减少,以及对专用加速器的需求增加,为新来者敞开了大门。据估计,有200家初创公司正在研究AI/ML加速器,其中一些正在使用RISC-V.作为起点。

使RISC-V特别有吸引力的是能够修改源代码。这使得它在边缘和嵌入式应用程序中推出了它的普及,但它也引发了希望使用这个开源的公司的兴趣ISA用于更高的性能应用。

“一开始,它在低端微控制器上有很多针对节省成本的原因,”Simon Davidmann(CEO)Imperas软件。“那么它成了人们试图做大量的流程阵列和高端矢量。但在过去的六个月里,公司推动了高能力核心信封的公司有很多兴趣,这是高性能计算和嵌入式之间的中间步骤。这些是多线程,多核,多集群的核心,如高端臂,它们正在推动速度包络。他们试图转到3或4千兆赫兹,所以这些不是低成本的嵌入式核心,而且它们不是巨大的阵列。它们非常高性能应用类型的处理器。What’s been seen in the RISC-V ecosystem initially was the low-end, ‘free’ efforts, to the high end ‘freedom’ work, now to these high performance cores, which shows that RISC-V as an architecture is applicable across all these different domains.”

要确定,不会有一个高性能计算的处理器。但RISC-V可以是工具箱中的另一个工具。

“当你看到高性能计算,它不是一个巨大的快速处理器,”尼尔汉德,IC验证解决方案市场总监说西门子eda.。“那不是它的意义。EU中的所有顶级计算系统都是大型分布式计算机。高性能计算中的单个核心的大小无关,因此任何处理器都可以进入高性能计算。RISC-V可以参加这一点。它可能成为一个扶手的替代品,并且有些公司试图做到这一点并建立更复杂的RISC-V处理器。但它真的很有趣,你可以自定义它。它不一定是一个高度并行的处理器,或者必须处理多个线程或多核,因为当您查看高性能计算时,它们在哪里?它们很多用于特定应用程序。你想做蛋白质折叠吗? Are you a military company trying to simulate decay of your military weapons over time in storage? When you start looking at those areas, you can build coprocessors for that specific application. And how do you build a co-processor? In the old days, you just built a hardware co-processor. Today, you could build a programmable co-processor, which could be RISC-V-based because you can take open source software and tool chains and make it all work. That’s not to say you couldn’t do the same thing with a hardware co-processor like an Arm or an Intel, but this gives you another degree of freedom.”

成熟的迹象
这个领域的另一个重大变化是工具数量的增加,这使得开发这些定制的加速器或处理器变得更加容易。

“在过去几十年中,在高性能计算中工作的最令人兴奋的事情必须是他们拥有的工具数量,”手说。“We’ve gone from the days of, ‘Oh, I’ve got to go build a Cray in order to have any chance to do anything meaningful, or let me go build a cluster of Intel PCs to go do something.’ Now you can build rich heterogeneous computing environments, and we see that with the cloud vendors — Google building ML processors, AWS adding Arm processors with accelerators, Baidu doing custom processes and using FPGAs in their systems, and so on. You can go to AWS and put a custom FPGA board into a cluster with a firewall. You can put a RISC-V CPU into an FPGA board in your [virtual] machine, and it’s all remotely controlled. The opportunities are huge, and it’s just another lever.”

这一切都没有在RISC-V社区丢失。“RISC-V的一个很好的特点是它的可扩展性和模块化ISA,因此在同一HPC产品中可能有几种类型的RISC-V,”Zdenek Prikryl,CTO密码。“其中许多支持某种排序的矢量处理以并行地处理大量数据。它可以由即将到来的RISC-V [V]扩展,或通过自定义VPU(矢量处理单元)来实现。需要该向量支持以满足HPC域中常见的AI / ML或其他数据激烈的计算。系统中可能是控制原因或数据移动任务的其他RISC-VS。因此,正如您所看到的,您可以使用相同的底层ISA以获取不同的目的,这是首先是RISC-V目标之一。“

事实上,根据市场总监Louie De Luna的说法,特定领域架构的开发是目前百亿亿次计算竞赛的最佳解决方案Aldec。“开源和可定制的RISC-V ISA提供了一个现实和可实现的路径,可以到达那里,但它将采用整个行业合作,共同共同创造一个坚实的基础设施,软件/硬件工具链和生态系统。各种科学领域的创新是HPC背后的主要驱动因素,每个领域都有一系列独特的计算要求和工作负载。RISC-V的模块化设计方法和可自定义说明,可以满足这些要求。将来的新系统和SOC将在未来的单一ISA提供许多优点。我们知道ISA是硬件和软件组件之间的主要界面,但它也是硬件和软件团队之间的合同。对于今天的SOC,至少有五种不同的ISA。为整个SoC拥有一个ISA,将简化开发和商业周期中的许多领域。“

这可以大大加快工程团队的过程。

“大多数HPC算法仍然存在于类似的源代码形式中,这使得他们可以由广泛的软件开发人员,科学家和研究人员使用,”aldec的硬件师总经理Zibi Zalewski说。“这些算法需要快速操作来解决实际问题。因此,类似于基于FPGA器件的硬件加速器在HPC中流行。为了实际使用基于FPGA的硬件中的算法,必须使用高级合成转换算法,或者在HDL中重写,以考虑FPGA架构的具体细节和优点。但这是一个耗时的过程。它需要适当的技能和经验,这意味着用户组仅限于FPGA工程师。但是,如果RISC-V在FPGA中实现,则该过程可能会更快,更多的用户可用。在平台(如FPGA加速板)中实现的算法,带有RISC-V板,允许硬件加速和可伸缩性,而无需将代码端口到HDL。此外,RISC-V的可定制性质允许设计团队将处理器调整到算法要求以实现最佳效率。“

扩展基础
其中大部分是risc-v的原始目标一致。其中一个创始原则是可扩展性。

“他们希望一个ISA,将从微小的嵌入式物品中扩展到高性能矢量应用,AI应用和高度可扩展的应用,并指出梅根·沃赫,展示展览会的工程师副总裁。“它被设计为从32位和64位到128位,都具有相同的ISA。RISC-V在边缘谈论的事实主要是时间,基于它的成长方式。这是一个非常新的,它正在迅速增长,所以它首先在边缘采用,因为这些部分的问题和标准非常好地敲响。对RISC-V的即将批准的矢量扩展是巩固的,管理程序和其他更复杂的扩展位于堆栈中升空,RISC-V基础正在锤击并巩固这些。作为一个社区,RISC-V正在上升。“

批准和整体RISC-V载体发育,刺激了对RISC-V的HPC的兴趣,因为在欧洲处理器倡议(EPI)的领导之后,每个人都在杰出的报告,悉尼亚全球通信负责人。“他们正在使用RISC-V矢量,以及RISC-V特定IP来构建SOC的AI加速器部分。我们看到了AI架构的寒武纪爆炸,这很棒。每个人都喜欢竞争。它刺激创新,创造了各种巨大的解决方案,但它也有这个问题,现在每个人都在同一件事上工作,这是一个相同的软件,而是对于不同的平台。人们正在寻找的是商品化/标准化,因此他们可以通过没有感觉到他们正在做所有的工作。他们希望利用更多的社区努力。“

aldec的de luna同意了。“开源RISC-V ISA的灵活性是其最大功能之一,但它也会导致其最大的下行,这是碎片化。如果某种方式的灵活性变得无关紧要,这会导致不兼容。软件应用程序,操作系统,编译器,在给定的实施情况下工作的调试器可能与另一个实现不兼容,需要防止这一点。“

与此同时,选择正确的RISC-V核心也是一个挑战。Zalewski说:“目前已有多种RISC-V内核可用。“要知道该选哪一个是一个挑战。对于HPC应用程序来说,哪一个足够成熟、足够快且易于扩展?这需要知识和专业知识。”

下一步
Codasip的Prikryl期望看到RISC-V核心很快出现为主要CPU。“我们只需要完成一些家庭作业,如虚拟机管理程序扩展,并实现RISC-V的高级版本。最后一个重要的考虑因素是,在这些用例中,内存子系统也是至关重要的。系统必须正确地向矢量处理单元提供数据,因此可以正确地利用所有并行性。“

这也提高了RISC-V的可见度,以便更好或更糟。“如果您要从工具箱中使用新工具,您必须确保工具不会破坏,”西门子EDA的手说。“risc-v的挑战,一旦您定制它,就是您可以在自定义指令中放入10,20,最佳性能提高100倍,所以您必须确保它有效。”

这意味着灵活确认需要解决方案,包括应用于工具,更好的验证环境和便携式刺激的机器学习。“所有这些事情都在帮助我们到达这一点,”手说。“用RISC-V你有一个框架,所以你的90%的工作已经完成了。您已收到核心指令集,核心编译器,您知道如何挂钩API,这就是它对高性能计算的有趣的地方。如果您要建立一个,您可以继续构建自定义处理器,或者您可以下车并利用今天存在的东西。它不打算与英特尔的PC桌面竞争,但您可以将其中2,000个核心放在核心上,将该芯片放在数据中心,现在您已经为您想要看的任何东西有一种可笑的快速系统。但是,我们必须回到我们如何验证它们?“

超级计算与RISC-V
RISC-V HPC空间中发生的工作的一个例子在巴塞罗那超级计算中心。

“欧洲正在努力了解它在高性能和数字时代如何相关,”巴塞罗那超级计算中心的马伦斯特兰实验Exascale平台(MEEP)协调员John Davis表示。“对于数字自主权或主权来说,这是一个非常大的推动力,主权作品真的是在高性能计算方面驾驶这个观点。从BSC角度来看,我们为HPC提出了一个完全开放的堆栈,从处理器和加速器一直到软件侧。我们已经使用Linux在软件方面完成了。我们是第一个将2004年部署Linux的超级计算中心作为超级计算机操作系统。我们查看既开放和封闭源的各种软件堆栈,但是有许多开源变体用于许多HPC组件。我们需要创建一个专门的基础架构,而没有开源生态系统,很难这样做。使用RISC-V,我们的功能不仅可以改变硬件,还可以更改软件,而在它只是软件更改之前。那么问题就会成为生态系统的成熟问题。“

戴维斯说,在硬件方面,就很近,戴维斯说。“您可以使用任何ISA构建一个处理器并完成事项,因为您有能力自定义ISA,您可以添加说明等,并且您可以使其工作。From a software ecosystem point of view, while open source software is very useful, you still have to port that ecosystem to the platform so software maturity is probably the biggest impediment to broad scale adoption of RISC-V, and that’s going to take time.”

尽管如此,需要开发很多用于超级计算的碎片,包括驱动程序支持,Fortran支持最新版本的Fortran,OS,库和应用程序软件。“我们一直从硬件上完成全部堆栈支持,”戴维斯说。“我们在2019年5月录制了一片芯片。它是一个微控制器,但它是让我们在高性能计算空间中可能找到的建筑芯片路径的第一步。我们还建立了具有类似功能类型的加速器。“

结论
它仍然没有完全清楚RISC-V将获得最大的牵引力,但这种开放源ISA的市场肯定似乎正在扩大。工具和验证仍然存在问题,并且对其执行与更多商业导向的竞争对手有关的缺陷问题。但至少,没有人仍然质疑RISC-V是否有未来以及它是否是市场的严重竞争者和思维。

现在的问题是它在高性能应用中的真实条件下它是如何在实际条件下执行的。大部分设计世界都将密切关注。



发表评论


(注意:此名称将被公开显示)