中文 英语

推动硬件辅助验证的限制

随着复杂性的不断增长,对大型铁工具的需求是无止境的。

人气

由于半导体复杂性继续升级,因此依赖硬件辅助模拟,仿真和原型设计。

自芯片设计首次开始,工程师抱怨其设计目标超出了工具的功能。这尤其明显验证和调试,继续占据设计周期。大型铁工具使设计团队能够通过并行,更多和不同的加工元素的组合来保持速度,以及通过加工元素的组合以及增加机器学习。

至少就目前而言,这一趋势似乎没有任何软化迹象。更多的功能、更多的晶体管以及芯片内部和芯片与系统之间更多的潜在交互需要大量的计算。在某些情况下,这涉及到单个芯片,但越来越多地涉及到封装中的多个芯片。进一步推动这一趋势的是在安全和关键任务应用领域的先进设计的爆炸式增长,在这些领域,客户要求芯片的功能寿命更长,通常是在复杂系统和系统中的系统中。

“芯片设计变得更大,更大,”Simon Davidmann,CEO治之软件.“这意味着什么是RTL仿真和验证在人们做门级仿真时,以与早期相同的方式磨削。他们建造了加速器来解决这个问题。然后我们搬到了RTL,这给了一些加速。现在一切都完成了加速RTL,它都在模拟器中完成。为了速度,我们搬进来抽象并使用高级仿真和性能分析,或指令准确模拟。摩尔定律没有停下来。“

当设计类似于Apple的M1,使用160亿晶体管或具有12亿晶体管的AI发动机时,仿真和仿真正在用于验证,时序分析和建筑分析并不令人惊讶。主要是工程团队雇用模拟器加快RTL仿真,以及将软件置于Up并正常运行。这些尺寸的芯片的挑战是需要越来越大的铁,并且为设计成本显着增加。

“我们一直需要加快软件仿真的速度,而仿真是解决这个问题的一个方法,使用定制处理器,使用fpga。如果你没有模拟器,你可能不会认真去做验证,因为这是一笔巨大的开销。

借助硬件验证据统计,2018年第四季度的支出超过了RTL模拟西门子EDA.从历史上看,RTL模拟每季度略低于1.4亿美元,复合年增长率强。最近,这种增长趋于平坦。相比之下,硬件辅助验证的增长率为14%至15%CAGR。

四个市场主导了大多数硬件辅助的验证使用-传统网络(有线网络、以太网等);无线通信和WiFi;计算存储等计算存储设备;还有交通运输(包括汽车、公共汽车、出租车、飞机、导弹)。对他们来说,最大的两个问题一直是权力和性能。

西门子EDA产品管理/工程仿真和原型设计高级总监Jean-Marie Brunet表示:“功率和性能是巨大的挑战,因为它们必须在软件环境中考虑,而软件性能决定了半导体的成功。”“20年前,半导体的测量是基于其性能与硬件功能规格的比较。今天,仍然有一个规格,但产品营销人员销售半导体不再只有一个规格。他们必须得到性能/功率分析。”他们必须查看工作负载、框架和基准的详细列表。他们必须看SoC在系统中。SoC不再只是一个SoC。它是一个集成在系统中的SoC。或者可能有一家半导体公司推出他们所谓的芯片,但实际上它是一个系统,因为它是一个多封装的芯片。这需要得到验证,而且它正在成为一个非常重要的驱动,“我正在运行一套软件,软件如何对此作出反应将决定半导体实现中的设计是否工作。”’这创造了许多有趣的动态。”

模拟器带来的好处也带来了挑战。该公司半导体产品营销总监Marc Swinnen表示:“模拟器非常棒,因为它们非常快,你可以在模拟环境中更接近实时地运行实际软件。有限元分析软件.“问题是这会产生很多向量。我们说的是数以百万计的向量,然后它会以高速从机器中喷射出来。处理这一问题的传统方法是将数百万个向量存储在一个巨大的数据库中,然后开始仔细研究它,找出发生了什么。”

功率分析在所有这一切中扮演着越来越重要的角色,而仿真器已经被证明非常擅长于此。“从功率的角度来看,模拟器和功率分析软件之间可以有一个直接的流接口,这样当产生数据时,功率分析工具就可以实时分析输出流,”Swinnen说。“这意味着当模拟器完成运行时,向量从权力的角度真正有趣的——比如,峰值功率在哪里,什么是典型的典型的权力,这区域有不同的峰值功率相结合的活动创造更多的权力——已确定。然后将它们分离出来进行进一步研究。”

还能做什么?
改变的一件事是,随着公司投资硬件辅助工具,他们正在寻找其他方式来利用他们的投资。

有趣的是,今天的模拟用户在他们的大铁中寻找更多的灵活性。“大用户尤其在寻找企业级模拟器,他们不只是为了一个项目而购买,”Michael Young说,他是该公司的产品管理总监韵律.“他们可能会购买多个项目,并将其作为企业资源用于项目之间的共享。在项目中,有用于不同目的的多种用途。有些用于验证,有些用于软硬件集成,有些用于DFT.测试,有些是用于低功耗,功率分析或性能分析。仿真的旧日子,你只买了一个目的的仿真器,都消失了。用户正在寻找非常良好的抛光仿真器,几乎像验证计算机,因为它将用于许多事情。“

图1:硬件辅助的验证生产力循环。来源:节奏

图1:硬件辅助的验证生产力循环。来源:节奏

每天,设计/验证团队将构建一个数据库以运行仿真。这必须非常有效。无论这是一个有500,000到100万盖茨的IP,一个具有十亿个门的子系统,或者一个可能有数十亿个盖茨的完整SOC,DV团队需要一种方法来建立两三次的数据库。一旦他们构建它,他们运行它,找到一个错误,制作修复,然后做另一个版本。

用户想要的周转时间是一天两到三次,因为他们在全球各地有团队,想要一个三班倒的心态,24/7地使用机器。系统必须能够从最小的IP块扩展到芯片级仿真。事实上,现在许多工程团队都在做多芯片仿真,将两个芯片和软件一起放在一起,看看系统级的效果是什么样子的。

此外,在企业级别的共享日,必须设置排队系统,优先考虑访问这些机器的访问。“你是一个优先工作吗?或者你是低优先级或中等优先权吗?所有这一切都是关于作业分配的效率。然后是运行时以及调试。人们购买了一个仿真器,不是因为它看起来很漂亮,而不是因为它跑得很快。它需要能够具有高调试效率。“

新使用模型
在模拟中全面推进极限也会产生新的使用模型。

“在仿真的早期,DV团队知道也许是一种或两种方式来使用仿真器,”年轻人说。“今天我们正在跟踪20多个不同的使用模型。大多数团队可能永远不会在一个项目中做20个不同的任务,但在董事会上,思考正在发展如何申请仿真机。“

其他人也报告了类似的趋势。约翰内斯·斯塔尔,高级总监,产品营销synopsys.,指出了对更特定于应用程序的模拟器的需求,这些模拟器被定义为针对特定用例(如功率验证或软件开发)进行性能优化的模拟器。相比之下,通用仿真器为各种各样的用例提供性能、容量、调试和灵活性。

在一个应用程序特定的例子中,硬件可以用来练习设计和软件。然后,功率计算软件可以利用设计出来的活动,快速计算单个系统内的功率。

“在Terabytes中有仿真器的数据如此之多,在Tberabytes中有数据尺寸。”Stahl说。“如果您有孤立的软件在其他地方运行,你不能这样做。您需要将仿真器密切连接到实际计算电源的计算服务器。然后,您实际上可以将一大块数据转换成小块,或可以解决的碎片 - 也许是100个处理器CPU。这是我们用来达到这个短周转时间的秘密。“

其他特定于应用程序的实现包括IP验证和网络设计验证。

“在模拟器内部,这意味着我们如何将特定于应用程序的部分与核心仿真基础设施集成,比如我们如何通信,以及我们如何处理大型数据,”Stahl解释道,“这都是关于以一种有效的方式在模拟器中输入和输出数据。然后是以正确的方式对数据进行预处理或后处理,以获得该用例的最佳周转时间。对于网络来说,它是指你可以通过生成帧的系统得到多少帧,将它们发送给模拟器来模拟它们,然后取回它们并测量它们是否正确。这是总吞吐量。对于能量,它产生活动并计算能量。这基本上是你在那边得到的周转时间。对于IP验证,它归结为在进行下一个RTL交付或下一个软件交付之前,您可以多快地完成这个IP的回归运行。”

另一种模拟使用模型是混合模型,它在过去几年中变得更加普遍。

“仿真器由于他们需要提供的能力而越来越大,并且用户发现他们可以使用处理器的软件模型等混合模型进行混合模型,以加快进程,”Davidmann说。“如果您尝试验证处理器,那就没有太好,但是如果您从ARM购买IP,例如,它已经预先验证,所以您不需要担心。你只是用它作为一个工具,它是你真正担心的软件。“

结论
考虑到在验证时的许多考虑因素——无论是机器学习、人工智能、深度学习、ADAS还是高性能计算——每个应用程序的共同之处在于功能和性能。其他一切都是次要的,西门子EDA的Brunet说。

“要准确衡量权力和表现,你不能作弊,”他说。“你必须能够测量它。为了衡量它,如果你退后一步,你需要有能力有能见度。如果您不能调试,如果您不能具有可见性,那么您就不能真正地度量它。你对它进行抽象的测量。所以你必须问,‘当我给出工作量的参考编号时,我是否准确?这很重要,因为软件会通过这种方式告诉你你的半导体是否有价值。准确的程度不仅仅是一个高层次的标准。它迫使该方法能够准确地提取数据。因为你有可视性,你正在运行一些东西,如果你发现了问题,你需要能够调试,因为你需要继续处理芯片。”

向前迈进,Synopsys'Tahl预计将始终存在通用机器,但不孤立。“他们将始终通过令人信服的事件来完成下一代的令人信服的事件,而且通常在仿真世界中,下一代仿真芯片驱动下一代硬件是毫无秘密的。这将继续继续。在原型方面是相同的。最后,我们将继续查看更多地满足用户最重要的担忧的特定于应用程序的模拟器。“



发表评论


(注意:此名称将公开显示)