中文 英语

HBM Upstages DDR在带宽,电源

设计挑战和刀具流动差距出现,但实际世界PPA指标也是如此。

人气

对于图形,网络和高性能计算,高带宽内存(HBM)的最新迭代继续作为对传统DDR,GDDR设计和其他高级内存架构(例如混合内存立方体)的可行竞争者上升。

HBM.通过I / O和更高的带宽存储器访问能够降低功耗,具有更加冷凝的外形因子,其由堆叠存储器直接在彼此顶部的顶部进行,并使用硅插入器将相同的包装作为SOC或GPU核心。每个引脚驱动更短的迹线,并以较低的频率运行,从而导致切换功率显着降低。

高带宽性能增益通过非常宽的I / O并行接口实现。HBM1可以提供128GB / s,而HBM2提供256GB / s的最大带宽。通过向堆栈添加更多模具或添加更多堆栈来轻松缩放内存容量,或者向其添加更多堆栈system-in-package

截图2017-03-21 (7.59.14 PM
图1:HBM1与HBM2。资料来源:SK Hynix

使用HBM的公司刚刚开始报告现实世界的绩效编号。埃斯利昂在其他DDR方法中发现了8倍带宽随HBM增加。和synopsys.发现仅在DDR4和HBM2的物理接口中,每比特的相对能量就减少了5倍,仅在数据传输部分。

这促使围绕HBM的设计活动激增。公司产品管理高级总监弗兰克·费罗表示兰姆斯,是什么驱动了这种能力,以存在动态随机存取记忆体2.5D技术并使用更正数据管道,加快数据吞吐量,从而减少驱动信号所需的电量,切割RC延迟,将其更接近处理器。

“最初,高带宽内存被图形公司视为进化方向上的明确一步,”Ferro说。“但是后来,网络和数据中心社区意识到HBM可以在他们的内存层次中添加一层新的内存,以获得更多带宽,以及驱动数据中心的所有东西:更低的延迟访问、更快的访问、更少的延迟、更低的功耗。因此,HBM设计活动在这些细分市场加快了步伐。”

HBM设计挑战
然而,该公司高级区域技术经理Calvin Chow指出,这些优点带来了挑战,HBM的设计中引入了相当多的优点ansys.。“其中之一包括计算HBM I/ o的功率噪声影响。尽管每管脚的功率更低,但有更多的I/ o并行触发,导致电流消耗显著增加。虽然信号轨迹较短,但由于大量I/ o的同时切换,仍然存在噪声问题。”

他解释说,考虑到在一个HBM设计中有超过1000个PHY I/ o,测试/调试一个HBM设计比传统的基于DDR的设计更具挑战性,因为它很难探测数千个PHY I/ o的微隆起。“再加上多个部件可能来自不同的来源——内存和控制器芯片、SoC芯片、硅插入器,包裹而且调试故障或性能问题可能会非常困难。在整个设计过程中,准确地建模每个部件是非常重要的。”

此外,随着较小的模糊的形状因子,当使用HBMS设计时,热含量是另一个关键焦点区域。

事实上,HBM包的热特性非常重要,使我们不得不做多个热试车辆,以确保我们将推荐的东西不会导致HBM堆栈本身开始失败,“Deepak Sabharwal说明, general manager of eSilicon’s IP products and services. “The power integrity is also very important. You have to make sure that you’ve got proper meshing going on inside the die and connections to all these microbumps so you do not have high resistance because you’re concentrating too much current in one area versus another.”

Chow表示同意。“堆叠的内存死亡倾向于叠加热量,因为它创造了一个阻塞的热流路径。不仅要验证热冲击性能,还要验证热完整性,以确保导线和过孔满足预期的使用寿命要求。人们还应该意识到热量是如何从SoC耦合到内存的,反之亦然。封装层和硅衬里层也可能容易受到热诱导的机械应力。因此,了解HBM设计的热效应对于确定系统级所需的冷却是至关重要的。”

屏幕截图2017-03-21在8.02.03下午
图2. HBM连接到插入器。来源:三星。

权力/性能权衡
Synopsys DDR控制器IP产品营销总监Marc Greenberg表示,从设计师的角度来看,HBM的设计不同于以往的堆叠结构。首先,HBM是一个多通道体系结构。除此之外,还有一个关于如何利用HBM中所有带宽的问题。

Greenberg表示,工程团队仍然面临着传统的电力/性能权衡,但HBM在每比特能量的基础上帮助解决了这一问题。“出于一些原因,HBM在DRAM和SoC之间传输数据的能量上相当有效。接口的本质是连接很短,处在一个很好的通道中,电容也很低,所以你只是把一个很小的信号推了很短的距离。不像DDR4信号从SoC,通过一个包,PCB, PCB, DIMM插座,拐一个弯进入DIMM插座,上升到DIMM,跨DIMM扇出,然后进入DRAM -有很多的阻抗和电容与这条路有关。HBM中这种情况较少,因为路径短得多,控制得更好。”

此外,在HBM接口中需要使用的信号调理技术比在DDR接口中要少。他说,这些技术在DDR的案例中发挥了作用,但在HBM的案例中却没有必要。

何时谈到更新,Lou Ternullo,产品营销集团导演的内存,存储和接口IP韵律提醒说,通常有两个旋钮可以转动增加原始带宽。一个是时钟频率 - 数据率越高,带宽越高。另一个是可以同时访问的数据引脚数。例如,如果系统是32位,则在相同的频率下,如果将比特数倍与64加倍,则带宽有效地加倍;因此,HBM实际上是1,024位 - 这比今天市场上的任何其他DRAM都显着宽。

那么如何做到这一点,并仍然减少电力呢?他断言权力方面是相对的,它必须在相对的背景下看待,否则它就不是苹果对苹果。“例如,如果有两种不同类型的记忆——A和B,供讨论——它们运行在相同的时钟频率,相同的带宽,你希望得到更低的功耗——这就是你想要在这种情况下实现的。他们的方法,是通过玩弄物理定律来实现的。通过在微隆起和硅干涉器等周围设计整个生态系统,该技术允许在不需要过多的终止量的情况下以相当高的数据速率传输,这降低了功率,因此获得了带宽增益。这就是物理定律的作用。”

当然,所有这些复杂性都会增加BOM,Ternullo指出。“本身就是一种新技术的硅插入器增加了更复杂,材料清单增加。您需要寻找高带宽的应用程序,产品中具有合理的余量来支持更高的成本系统。与只是购买定期DRAM并将其放在董事会上,系统将更昂贵。基本上我们所看到的是网络应用,高性能计算,这些类型的带宽需求,以及高保证金产品。从它中取出成本因素,只是看着带宽和可能解决的问题,理论上可以是其他应用程序 - 这是解决方案的价格点数足以适应其他市场的问题。“

工具流动的空白

然而,尽管有这些优点,设计工具在涉及HBM时还是比较滞后。

“今天有大量的空隙,”Sabharwal说。“你今天在PCB上做了什么,你把ASIC放在哪里,你把一些其他DRAM放在PCB上并全部挂钩。现在您正在拍摄那种集成水平并将其放在一个包内。这是传统的ASIC设计师不必担心的东西。芯片将通过引脚创建。现在,它是设计师的工作,可以连接两个芯片,并做所有的板设计工作。现在,曾经在PCB上的一切设计师必须确保插入器旨在运行所有这些曲目。今天,没有工具可以这样做。“

没有办法正确提取插入器,因此商业工具用于模拟归纳效果。Sabharwal说,有新的工具,但设计团队已经回到了使用传统的野外求解器来获得插入者的真正R&C特性,以攻击提取挑战。

刀具流动的另一个间隙是缺乏运行的能力LVS.(布局与原理图)。由于Sabharwal解释说:“在芯片内部,我可以运行LVS,并确保我已经弄清楚了我的连接,并正确完成。但是,当我在包装内部将两个芯片放在包装中时,我如何确保我已经正确完成了连接?There are routing signals between the two chips, and LVS can’t be run in that environment so engineers come up with their own homegrown scripts, create bump-out patterns from one chip, and for the other chip they get coordinates, then write scripts to make sure that the signals are tying off correctly.”

底线是解决方案不能太快到来。

结论
利用高带宽内存的位置仍在展开。这是一种新技术,其优势刚刚开始记录。

HBM今天正在进入前沿图形,网络和高性能计算。但它也可能在深度学习,人工智能方面找到了一个角色,卷积神经网络特别是当插入器的价格持续下降,芯片制造商积累了足够的专业知识和使用这种新型存储类型、不同架构和封装的历史时。

相关案例
整理下一代内存
一个长长的新内存类型列表正在击中市场,但是哪些是成功的,尚未清楚。
记忆的未来
专家们,第2部分:2.5D和扇出对功率和性能的影响,以及这项技术何时会成为主流。
卷积神经网络前方的力量
采用这种机器学习方法的图像识别增长;其他应用程序需要性能和性能改进。
DRAM的下一步是什么?
由于DRAM缩放耗尽蒸汽,供应商开始查看替代包装和新的内存类型和架构。



1评论

cocketus popetus. 说:

Radeon R9 Fury X(斐济XT)
2015年6月24日发布推出了我的印象。这是踢的概念芯片证明,踢出全HBM生态系统。

发表评论


(注意:此名称将被公开显示)