中文 英语

堵塞机器学习中的孔

第2部分:短期和长期解决方案,以确保机器按预期表现。

人气

使用机器学习的公司数量加速,但到目前为止没有工具验证,验证和调试这些系统。

这对芯片制造商和系统公司越来越依赖机器学习来优化其技术的问题,这是因为至少现在,它创造了极难追踪和修复的错误的可能性。与此同时,它为一直开发静态工具的公司开辟了新的机会,以便在芯片超越芯片超越芯片,利润被系统供应商挤压。

但如图所示第一部分这个系列,这将需要数年而不是月份来解决。研究刚刚开始解决这些问题,更不用说开发综合工具套件。

“穿越董事会,机器学习突然变得非常有趣,”Sundari Mitra,CEO和联合创始人NetSpeed系统。“如果您在机器学习方面查看整个EDA行业,所以它已经是合成的。随着我们在机器学习中的背景下出了更多的人来说,专业从事这一点,他们将获得一些这些东西。我看到一个运动 - 当它变得痛苦时,有人会赞助这一点。他们会让某人注意这一点,并应用一些这些技术来解决一些模拟问题。“

那么Chipmakers在此期间做了什么?

短期解决方案
现在有几种方法可以减少潜在的问题。一是严格限制机器学习的用途范围。

“您可以提出适应的机器学习算法,如过去发生的功率,”营销副总裁Mike Gianfagna Mike Gianfagna说eSilicon。“但这是一种激光关注特定问题。你必须限制范围,或者你有一个巨大的问题。如果您确实存在问题,则数据不好,自适应学习是坏的,或者您需要优化算法。但是这里也有很多微妙之处,就像让进程正确一样。这不是机器学习,但它会影响它。当你去28米和下面时,物理规则并不总是适用。所以你可能有一个温度反转。您的数据是固体吗?您必须确保机器学习算法正确适应。“

GIANFAGNA表示,通过并发故障仿真,故障电路的数量扩大和收缩。“实时跟踪所有这些电路就像管理扩展和承包宇宙一样。这将使我们带到很多有趣的方向,我们将不得不平行地以人脑功能的方式做得更多。如果你看看人的大脑,那并不是那么快,但它是自适应的。如果你看一下机器学习问题,根据定义,它们并不妥善。“

第二种方法涉及更多的混合方法,由此基于特定功能的编程“教授”的机器,这是当今智能手机所做的。

“机器可以在不使用认知学习或AI的情况下从错误的行为中学习,”Tirias Research的主要分析师Jim McGregor说。“如果需要更复杂的响应,则使用设备上可用的资源并利用云。大多数计算机仍然以非常基本的方式“学习”。在那里,这更复杂的是自动车辆,你真的需要机器学习和ai来解释环境,利用该环境,永久改变算法。在这种情况下,调试是一个完整的世界。你不是在寻找问题的变化。现在它是关于指示和提供反馈。“

第三种方法是将功能的任何变化限制为软件。虽然这不是从电源/性能的角度来看的,但理论上它更简单地调试。该方法已经通过MovIDIUS使用,这使得视觉处理单元。“你依靠一个在云中训练的网络,足够的数据集,”David Moloney,Movidius的CTO说。“这不是连接到CNN(卷积神经网络)的大量发动机。它在软件中完成,因此如果存在问题,它是一个软件问题。有专用硬件的风险。使用软件平台,您不会锁定在硬件上进行的决策。“

Moloney说,机器学习的一个大问题是每隔几天的事情发生变化。“包括工具算法和网络拓扑,”他说。“这样你使用的平台并不重要。但网络更深,功耗越高。网络中没有线性回报电力,因此挑战是提出节能的网络。“

长期解决方案
硬件和软件的结合是优化系统的一种更有效的方式,但它也更难控制。机器学习基于大量的数据,这就要求采用数据挖掘等大数据方法。而使用数据挖掘调试系统则属于预测分析的领域——用模式预测行为。

“你真正做的是寻找行为的异常值,”首席核查科学家哈里福斯特说导师图形。“今天约72%的设计有一个或多个嵌入式处理器。你开始验证过程,往往不是你所期望的。因此,您可以使用机器学习技术进行数据挖掘,并且您发现了一个。数据挖掘在这种情况下被用作验证工具。随着受限制的随机生成,您正在查看操作的延迟。通过数据挖掘,您可以通过大量的数据扫描,并弄清楚为什么运行需要花费五倍。它与机器人相同。你无法教授机器人所做的一切方面。它必须进化。 But that requires whole new ways to validate systems. So while the algorithm is learning, an agent also needs to be learning. That allows you to work back and forth in validation.”

福斯特说,这将需要更多的统计分析来识别奇怪的行为。“使用我们现有的方法,您可能运行了数千次,但永远不会发现问题。使用数据挖掘,您可以发现在其他任何地方都找不到的问题,然后调试根本原因。但这比我们现在所做的更具有统计学意义。”

弹性和容错是另一种长期方法。几十年来,这个概念已经存在于计算世界中。例如,纠错码内存(ECC)可以检测和更正存储器位中的错误。同样,大多数系统都被备份,大多数大公司都有故障转移系统,以防出现问题。

“汽车行业越来越多地采用IP重复,”查理······动脉杆菌“主席和首席执行官。“这是对抗软错误的一种方法。如果使用重复的IPS将图像处理器转换为数据包,则可以获得功能参考信号。如果存在分歧,则会收到错误错误。它就像互连内部的ECC。使用机器学习的系统是相似的。您需要足够的探测点来隔离问题。最终我们需要抵抗过境的SOC。但我们还需要了解可能出错的事情是什么。我们还不知道所有机器学习错误是什么。“

机器学习前景
事实上,机器学习令人惊讶的是它已经在这么多的地方被使用,因为错误会出现在哪些地方是不确定的。尽管有关机器学习的基本概念已经讨论了多年,但它们的应用更多的是理论而非实际。例如,如果数据不可用或连接不可用,会发生什么情况?这如何影响机器学习,特别是当涉及到物体识别时?

“这是完全新的,”Leti首席执行官Marie Semeria说。“首先,我们必须考虑使用。我们需要什么?这是一种完全不同的驾驶技术。这是一种神经形态的技术推动。首先要弄清楚你需要的东西,然后你开发一个解决方案。“

Semeria表示,Leti正在开发由IoT应用程序驱动的芯片,其中研究房屋展示了功能,并要求最终用户反馈,以确保开发工作满足他们的需求。“它更像是一种能够与客户讨论全球解决方案的系统方法。所以我们完全改变了我们推动研究的方式。这就是我们这些天在CES的原因。“

这也有助于放置英特尔收购阿尔特拉进入视角。英特尔一直将机器学习推推作为优化数据中心操作的方式,但是由于FPGA的可编程结构,使用FPGA比ASIC更容易使用FPGA更容易。

“我们已经看到了对HIL(循环)固件测试的更多兴趣,”产品营销副总裁Kevin Ilcisin说国家文书。“这个想法是您可以在FPGA中更改硬件结构,但您需要能够抽出测量。”

其中一些工具已经存在,所以不需要从头开始开发所有这些工具。但这些工具最终将如何被参与机器学习的公司使用,以及还需要什么来提高它们的效率,目前尚不清楚。在汽车行业尤其如此,驾驶员辅助将是由机器学习的场景集合。

该公司高性能ASIC原型系统技术营销经理Achim Nohl表示:“在硬件和软件方面,现实世界的测试越来越成为一种需求synopsys.。“我们将看到越来越多的卷积神经网络加速器,我们将不得不从设计验证扩展到现实世界中的系统验证。您需要尽可能确信系统将正确地作出反应。是否有必要对场景进行标准化?是否有必要对参考数据集进行标准化,这样汽车就可以对它们做出反应,而不必担心特定系统的性能?如今,我们对测试数据进行了标准化,但还没有涉及到真实场景。”

NoHL注意到,还需要测试数据并快速共享,以便有用。“这不仅仅是一种软件或硬件问题。我们将在几乎每个字段中都需要长长的调试跟踪。“

结论
因为机器学习才刚刚起步,关于开发有效工具需要什么、它们什么时候准备好、它们的成本是多少,还缺乏确凿的数据。在这一点上,没有人能确定这些工具到底是什么样子的。

“一旦你有数据,更大的问题就是你要做的事情,”总裁兼首席执行官Raik Brinkmann说奥克森解决方案。“这是一个没有测试台的系统或概括行为的任何方式并验证它。由于机器学习,建立的方式正在改变。您基本上将在汽车中有一台大型电脑,如果数据延迟,它将无法正常工作。所以你有传感器融合,你可以尽可能地推到中心,你可以创建可以尽可能靠近传感器进行机器学习的SOC。“

只有这种方法的遗体仍有程度才能看到。“正确性的性质是不同的,”克里斯·雷伦说,“韵律公司知识产权集团的同家和首席技术官。“你必须采取统计措施来管理这一正确性。有些人说这是一个改变较低级别验证性质的机会。有些提出了更加强大的架构的新方法。但我们所知道的一件事是深入学习和机器学习有助于开辟新的设计自由度。“

有关的故事
机器学习部分缺少了什么
教导机器如何表现是一件事。理解可能在这之后可能的缺陷是另一个。
在AI和深度学习中
在AI中发生了什么,今天的硬件可以跟上什么?
芯片设计的认知计算手段是什么
认为自己的计算机将从平均SOC的设计不同;生态系统的影响将是重要的。
新架构,加快芯片的方法
性能指标在10nm和7nm发生变化。速度仍然很重要,但不能一刀切。
一个一对一:约翰·李
将大数据技术和机器学习应用于EDA和系统级设计



发表评论


(注意:此名称将公开显示)