中文 英语

可靠性定义正在改变

系统中的复杂性和漏洞正在提高关于构成全功能设计的问题的问题。

人气

由于本发明的集成电路,因此通过芯片继续工作多长时间来定义可靠性。它要么打开并做了它旨在做的事情,或者它没有。但这种定义不再是如此黑白。SOC,甚至IP或内存块的部分可以继续运行,而其他部件则不进行。有些人可以间歇地或以较低的速度工作。其他人可能会在温度下增加到它们要么关闭或减速的程度。

这在电子行业中引起了一些有趣的问题,从法律责任,到功率和性能的设计目标,到任何功能系统(尤其是关键系统)与那些非功能或边缘功能的区别。就像系统变得越来越复杂一样,围绕着它们的指标也越来越复杂。

“这不再只是关于一个系统的老化,”系统开发套件的产品营销总监Frank Schirremeister表示,“韵律。“我们开始看到更普遍的问题,比如系统是否满足了一开始设定的期望。如果你有热问题,系统可能在做它应该做的事。有复杂的逻辑来打开和关闭它,您已经做了性能验证以确保它所有工作。但如果你运行了6分钟的高负荷计算,在热效应的影响下,它可能会慢下来。所以处理器的性能会随着时间的推移而下降。你能坚持多久才能达到预期的效果?”

更大的图景
可靠性测量不会使用单个设备停止。它越来越多地涉及连接到一个或多个其他设备的一个设备,并且可靠性可以根据初始设备的设计而取决于那些其他设备。例如,考虑智能汽车,可以与其他智能汽车通信,以防止盲曲线周围的碰撞。但是,如果其中一辆车未能沟通和警告迎面而来的汽车,会发生什么?即使两个通信系统正在运行,也可以发生,但是一辆车比另一辆车更新,并使用不同的通信协议。

微软系统级工程部总经理Serge Leef表示:“嵌入式设备的组装方式正在发生变化。导师图形。“在过去,它都是一个。您拥有硬件,存储和软件,包括实时操作系统或其他操作系统,中间件和应用程序。但它变得明显,今天和明天的嵌入式设备将是不同的。EDA一直专注于盒子,但这不再是合理的。你必须解决大局。“

这一前景远远超出了正在设计和测试的设备,即使是像智能车库门开关这样简单的东西,也可以通过互联网由智能手机控制。“设备现在有三个元素:边缘节点,在机械或本地控制下;中心节点,与边缘节点交互;在移动客户端上运行的应用程序,通过集线器与设备交互。”

任何一个领域的问题都会影响其他两个领域的可靠性。当问题确实发生时,可能很难确定故障在哪里。它可能是硬件,它可能是控制硬件的软件,或者它可能是在通信基础设施中,不受所有参与创建设备的人的控制。它可能是暂时的,也可能是永久的。

另一个可能影响性能 - 以及设备可靠性的另一个因素,如在通过云通信的两辆汽车的情况下 - 是数据访问。STEVEN WOO,解决方案技术副总裁Rambus,引用IDC的报告 - 他可以找到最保守的人 - 预测2011年和2021年之间的数字数据将增长44次。

“你必须搜索越来越多的数据,记忆力必须提高,”Woo说。“链路性能是数据中心的限制因素。计算和I/O也需要改进。”

这可能不会影响数据中心的可靠性本身。除非对于该数据中心的客户有响应时间保证,否则很难将跳转造成的跳跃引起的绩效减少呼叫。但它肯定可以使依赖于快速响应的设备难以满足其性能目标的一部分。例如,考虑两辆汽车以高速围绕盲曲线的示例。

工具失效的地方
其中大部分都适合尚未确定的灰色区域。对于外界而言,有时甚至在设计空间中,甚至在设计空间中,甚至在开发芯片的工具进化到自己的灰色区域时会发生什么。

“功能验证不完整的结果不太为人所知,”该公司首席技术官伯纳德•墨菲(Bernard Murphy)表示Atrenta。“时钟同步绝不是一个完美的解决方案,可以降低故障之间的平均时间。在整个SoC的后果方面很少映射。有时间例外。我们永远不知道功能验证如何不完整。但它几乎不可能获得99%覆盖范围。我们开始看到量化大型设计的不完整性的兴趣。“

Murphy指出,当设备在不同市场上使用时也会出现问题。因此,大型应用处理器的使用寿命可能不超过几年,但如果将同样的技术应用到汽车信息娱乐系统中,则需要使用10年或20年。它还必须在更恶劣的环境下工作。

在设计的前沿,事情变得更加混乱。以10nm的IP开发为例。

“由于积极的市场时间表,客户希望确保这些IP块在第一个实例化工作,”Navraj Nandra说,高级营销总监synopsys.'设计软件和混合信号IP。“这需要之间的相关性香料基本IP构建块的模拟和硅表征数据,如晶体管,电容器和各种纵横比的电阻。必须选择统计上有意义的设备数量,以确保模拟硅相关,具有不同的布局和密度依赖性,提供了由于电阻/晶体管匹配和金属错配的数据双重图案化三重图案化10nm。“

我们有可能深入了解这一切。环形振荡器和运算放大器等工具可以提供10nm工艺的门延迟和模拟性能的早期指示。目前的最佳实践包括过度应力设备,以评估由于负和正偏置温度不稳定、热载流子注入和静电放电对可靠性的影响。但Nandra指出,还有一些持续存在的技术挑战——确保使用早期版本的代工设计套件开发的工作IP硅,这些设计套件几乎是不断变化的,并满足PPA的要求。两者都是可靠性方程的一部分。

安全
最后,即使所有技术都按计划运行,每个过程节点都有缺点的安全漏洞,并且几乎每个IOT设计 - 即使它只是一种设计精心设计的硬件或软件。很明显,损害的设备不再可靠。但是可以损害的设备是不可靠的。

这些天,在安全领域有一种狂热的活动,从银行和零售商的入侵,到政府对网络犯罪和网络战的对策。这种趋势也在稳步蔓延到并购领域,最近的一个例子就是手臂s购买一个物联网软件安全公司为其嵌入式微控制器。

所有的处理器公司都在积极保护其核心。ARM已经有了它的TrustZone技术来划分内存和进程。英特尔在其处理器架构上采取了类似的策略,限制对核心架构的访问。Synopsys和想象力的技术该公司已经采取措施屏蔽处理器的入侵。但真正的挑战是,物联网通过许多渠道开放通信——从用于连接多个网络的I/O,到多层软件,再到片内和片外内存和存储。

甚至天线也会受到安全漏洞的影响,而且在任何连接的电子产品中,天线的数量都在不断增加。该公司负责产品工程和支持的副总裁阿维克•萨卡尔(Aveek Sarkar)表示:“这里有三件事需要考虑有限元分析软件。“一个是干扰。第二是耦合。第三是易感性。所有这些都会对芯片造成损害。”

结论
虽然工程师只能控制生态系统中属于他们自己的那部分,但未来在这些范围内可能很难定义可靠性。每一块都需要尽可能地设计得最好,但这并不意味着它在现实世界中是可靠的,因为还有很多其他因素会影响它。

“你可以有一个99.9999999%可靠的部件,但故障可能来自99.9%可靠的部件,”该公司首席技术官Drew Wingard说超声。“问题是哪一个最可能影响你。即使是ISO 26262(道路车辆-功能安全),也很少关注维修或延长寿命。在糟糕的事情发生之前,会有一份报告,但却无法从错误中恢复或纠正错误。”

Wayard表示需要在某些内容失败,供应商的质量,晶体管电线的可靠性,使用的氧化物以及它们的差异,逻辑层,软错误以及软件错误发生的事情时,以及软件错误会发生什么的可靠性。

但即使在所有这些中,它仍然可能不足以让事情保持和运行。在新的世界顺序中,一切都与其他东西相连,可靠性越来越多地被视为一个相对术语,这取决于设置,它连接的东西,谁是谁使用它。并且根据使用模型,它可能会从一个人到下一个人变化,一家公司到下一个。



留下一个回复


(注意:此名称将公开显示)