中文 英语

限制AI系统的功能

开发这些系统只是挑战的一部分。确保他们只做他们应该做的事情可能更加困难。

人气

新技术和方法开始应用于人工智能和机器学习,以确保它们在可接受的参数内运行,只做它们应该做的事情。

让AI/ML/DL系统工作是近年来最大的技术飞跃之一,但了解如何在它们适应时控制和优化它们还远远不够。如果在现场出现问题,这些系统通常是不透明的。对于算法是如何被利用的,或者决定其行为的权重如何随着特定的用例或与其他技术的交互而改变,几乎没有可见性。

机器学习是一个黑盒的方法,你不知道里面发生了什么,“三星的记忆业务部长高级副总裁Nam Sung Kim说。“对于某些应用领域来说可能是有问题的。”

事实上,欧盟本周发布了关于AI.-具体包括人工智能和自动决策系统-限制这些系统的自主行动能力,要求“安全可靠的系统软件”,并要求确保“人工智能系统及其结果”的责任和问责机制。

关注程度取决于根据设备应该做的,在使用它的情况下以及它连接到的内容的程度。例如,它可能是一些消费电子应用中的次要考虑,但在控制它们的网络中有更大的关注。

“这个问题是那个AI在哪里,”电力与传感器系统业务部的高级副总裁兼首席技术官Sandro Cerato说英飞凌科技。“所以云中有AI和IoT边缘的AI。最后,有许多AIS,它们具有不同的功能,具体取决于它们的位置。我现在可以与我的吸尘器通信,该吸尘器连接到网络,并且该网络的一部分非常智能。

安全性和关键任务的应用是一个特别关注的问题,特别是随着汽车、无人机和工业机器人的自主性水平不断提高,以及机器对机器学习被用于更新这些领域的系统。

Mythic的工程副总裁Ty Garibay说:“挑战在于神经网络的不可逆性,或者说黑盒性质。”“它是如何做出决定的?”此外,AI的统计特性也面临挑战。它可能是不正确的。如果你把一只猫的图像放到一个特定的神经网络上,这个神经网络经过训练,可以确定它是一只狗,那么它每次都会说这只猫是一只狗。对于数字处理器上的神经网络来说,这是正确的行为,但却是错误的答案。”

修复这些问题很困难,并且由于AI系统应该适应的事实使其变得更加困难。挑战是最大限度地减少该适应造成的任何抵押损害。

一般而言,含有AI的策略属于以下领域:

  • 有限的功能。为了确保AI系统不会偏离太远,目前最常见的策略之一是将功能划分到多个不同的AI处理器或系统中,而不是仅仅依赖于一个,并为关键任务或安全关键功能添加冗余。
  • 更好的模拟。在设计周期中早期了解设备如何与其他设备互动是公司开发这些系统的大部分问题之一,但它需要专门的模拟器具有足够的容量来包括多个元素,这增加了成本。
  • 实时监控。跟踪当设备杂散从其合法操作时,是否由于传感器漂移或算法中的缺陷或其他硬件,是越来越多地关注芯片级和系统级可靠性的另一个方面。
  • 更多的算法可见性。编写算法的新方法已经开发了好几年。到目前为止,这些工作仍在进行中。

对许多公司来说,限制功能显然是第一步。Xilinx的智能网络接口卡可以适应多种实现和连接选项。三星的HBM内存提供了一种本质上解决同样问题的人工智能芯片。许多EDA工具和芯片制造设备都添加了某种类型的机器学习(AI的子集)来识别模式和潜在问题。

下一阶段将更加困难,它需要更深入地理解系统将如何使用和强调,以及人工智能将如何适应各种操作条件和其他变量。在某些情况下,这可能需要一个数字孪生系统或某种程度的冗余,就像航空航天工业多年来一直使用的那样,它比较三个系统的结果,并使用两个最接近的。

“控制AI的最佳方法是将第二个系统采用,该系统是一种充当安全控制机制,如我们在今天的功能安全的硬件或软件中,”Raik Brinkmann说OneSpin解决方案。“你想要保护的东西是什么?你不想要ai的事情是什么?你想要捕获的坏情况是什么?您想尝试减轻这些风险。您无法完全控制AI,因为它太复杂,但您可以减轻风险。如果我们能提出一些方法和标准来解决这个问题,那就有所帮助。这可能包括家人想要检查的准备方案。“

这在很大程度上是基于对这些设备将如何使用的预测。芯片设计团队通常没有这些信息,因为他们是按照规范设计的,无论是单个芯片,一个包,还是一个子系统。但有时即使是垂直集成系统的供应商也会对他们的设备运行的环境感到惊讶,因为他们周围的技术变化得如此之快。

“你在设计阶段做了一些假设,但你不知道这些假设在部署阶段是否正确,”Anoop Saha说,他是战略和业务发展的高级经理西门子EDA。“当iPhone部署时,您不知道它将用于上传这么多Tiktok视频。在生产设备的生产之后,它完全改变了利用率。这也需要一些可配置性,因此您也需要将其放入SOC中。“

设计注意事项
很多AI/ML都专注于针对特定的用例或硬件配置优化系统,提高性能和/或降低功耗。但是,并不是每个设计团队都能访问相同的数据池,这使得这变得更加困难。在许多竞争激烈的市场,以及从设计到制造的许多环节,这些数据都是高度专有的,这使得设计和控制人工智能更加困难。

“所以净了净值缩小了,并且有一些问题的结构,使它们更好地映射到现有硬件,无论是CPU,GPU还是NPU,”技术罗伯阿特肯说:技术总监手臂。“但是,无论硬件是什么,它都会比其他硬件更好。使您的问题适合硬件始终是降低电源的好方法。长期,如果有一堆应用程序不恰当地融合到特定的架构或架构集,我们如何设计更好的或更新的架构?That’s where things like spatial compute come in. A bunch of it is constrained by, ‘Do you have the freedom to define the hardware for this project?’ Or are you using a particular hardware platform, in which case you need to adapt your system to work with its limitations and its capabilities. But if you’re in the position where you could define the hardware, then you have more degrees of freedom and you can do more stuff.”

对系统的所有碎片的访问越大,数据越多,结果越好。但是有很多数据,以及许多可能的交互,系统级模拟变得必不可少。挑战有一些需要模拟的系统的大小和复杂性。另一方面,在碎片中进行这种模拟具有有限的价值,因为可以在越来越复杂的系统中理解尽可能多的交互。

“这回路不仅仅是更加复杂,”产品管理和营销总监Hany Elhak说Synopsys对此。“现在我有很多不同类型的电路,它们是更大系统的一部分,需要一起设计。然后我们需要为这些不同的设计团队提供一些共同的流程,这样他们在设计周期结束时,当他们试图将这些东西连接在一起时,就不会出现问题。他们需要从一开始就合作。”

AI为此添加了另一个元素。从芯片设计的角度来看,AI设计或包括AI元素的设计需要就像任何其他芯片一样。通常不明白的是这些设备如何在适应后行为。

“对于AI来说,您有许多非常相似的元素,您在芯片上生成并并行化执行,但与无序处理器相比,元素本身相当简单,”Onespin的Brinkmann表示。“AI矩阵内的处理元件非常小且易于理解,也很容易验证。这是你可以控制的东西,今天做我们所拥有的技术。更大的问题是它在它上运行,那是软件。这就是AI的实际验证问题的位置。“

规模只会让问题变得更糟。Synopsys的Elhak说:“有些人工智能芯片是非常大的数字芯片,需要使用基础ip设计,它们需要在设计中与其他模块通信,比如高速I/O和内存接口,所有这些都需要精确和快速的模拟。”“为了实现AI,模拟器真的需要做比现在更多的事情。你需要模拟所有这些来验证这些人工智能芯片。”

寿命监测和指标
这只是起点。通过AI,必须持续监测。

“模型因为这样或那样的原因而漂移是一个真正的问题。围绕测量漂移和寻找控制漂移的机制,有一整套研究领域,”IBM人工智能计算部门主管杰夫•伯恩斯(Jeff Burns)表示。“我们的许多重要客户都在受监管的行业。他们需要对做出关键决策的原因进行审核。因为这些客户是谁,这包括整个人工智能生命周期。”

这需要通过某种循环系统对数据进行结构化、组织和模式筛选。

“学习,重新学习和重新培训是在工厂完成的,而不是在边缘,”Brinkmann说。“它可以组合来自AI系统的不同实例的不同输入,但基本上您必须拥有一个数字双监控该平台并有明确的理解。只想象一下,如果您在那里有一个系统舰队,并且您想升级传感器。有些系统可能有更新的版本,因此它们给您提供不同的数据而不是旧版本。将全部恢复在一起,以便您可以使用,要求您跟踪那里的内容。这是一个级别的配置管理,但您也可以将其视为数字双胞胎。您在工厂中拥有所有这些系统的型号,您可以模拟如果在实际执行此操作之前上传新版本会发生什么。“

实际上,它是一个随着系统进化而移动的参考点。它所解决的挑战是如何为AI的行为提供某种程度的解释。

“这是我们目前正在研究的东西,”德克迈尔说,他是分布式数据处理和控制部门的主管Fraunhofer IIS'自适应系统部工程。“这是一个相当重要的话题,因为这是一些东西获得认证的必要条件。如果你想使用人工智能算法,要离开原型阶段你就需要客户的接受。所以你需要一个认证的失败率或者其他工业系统的一些东西。我不确定人工智能算法目前是否满足这些要求。而且,你也没有那些算法可以预测它们是否满足要求,这是一个转移问题。您可能有一些针对这个应用程序和工作的特定机器的东西。你可以用真实的阳性率和假阴性率来预测失败。但当你把算法转移到另一台机器上时,你必须从头开始分析所有东西。”

利用数据
另一个相关挑战涉及AI系统中需要考虑的来自不同学科的越来越多因素。

Tensilica公司人工智能产品产品营销总监苏哈斯•米特拉(Suhas Mitra)表示:“架构一直在变化。韵律。“有很多研究正在进行。但是有什么方法可以使它变得万无一失吗?答案不是很清楚。您需要了解所有这些,并拥有一个能够快速有效地完成所有这些工作的软件工具链。然后你需要回到软硬件协同设计方法论,然后问,‘如果我利用这个新的网络,我需要如何改变我的硬件?我现在在激活函数方面做什么,如果我做3D和2D MAC数组会发生什么?所有这些不同的东西都发挥了作用,解决方案可能取决于你关注的领域。”

Mitra表示,这些域确定了任何变化的批判可能需要考虑两种因素。“一个是改变方面的时间效果。不同的垂直垂直有不同的要求。全部归结为电源,性能,面积和带宽。您需要分析网络并确定软件工具链中需要的改进以满足这些需求,然后确定我们需要调整硬件的方法。或者我们可以在硬件中做不同的东西来利用这些东西更好吗?利用两个轴都非常具有挑战性。“

反过来,这对这些系统的适应方式和大问题有关,可以跟踪追踪多个工程学科的许多可能的融合。

“机器学习比算法优化更多的数据工程,”西门子的萨哈说。“你如何消毒你的数据?你如何弄清楚哪些数据很重要?以及如何压缩数据,以便只有重要的位?这可能是机器学习的核心。现在跨越每个领域的数据量是巨大的,我们无法在速度或休息时处理大量数据。“

这里的关键是了解要保留的数据,播放的数据是什么,以及由于AI系统的变化,数据如何变化。这与言语或图像识别更容易,糟糕的结果显然是错误的。但是,没有连接到直接结果的数据更困难。准确性并不总是显而易见的,传感器漂移的东西及其对结果的影响可能需要更深入地了解这些系统如何改变。

“我们在演讲中做了什么,听到讲话,愿景是我们的眼睛和耳朵的局限性,”萨哈说。“我们的眼睛有什么看法?基于此,主要功能是什么?我们的耳朵对哪些事情敏感?但随着我们扩展不同领域的机器学习的用例,变得越来越难,有趣的挑战。“


图1:趋势线显示人工智能芯片每瓦特的计算能力随时间的增长。来源:IBM.

未来
尽管到处都有关于情报的大肆宣传,但对于关键职能部门,企业却在谨慎行事。迄今为止,大部分研究工作更多地集中在人工智能的子集上,而不是推动完全自主的机器。

该公司首席执行官西蒙•大卫曼(Simon Davidmann)表示:“在读研究生时,我的办公室旁边有位教授后来成为了欧洲人工智能领域的顶尖教授之一,他现在已经退休。Imperas软件。“他的结论是,它将永远采取真正的情报。机器学习是一个不同的东西。机器学习有助于数据分析并更好地预测事物。我喜欢我的车把刹车在一点点的情况下,如果汽车放在我面前。这是一个学到的东西,但这不是真正的智慧。我们在汽车行业中的一家客户使用模拟来分析汽车的速度。他们可以在车轮中看看ABS数据,并告诉您您的轮胎是否正在下降。是情报吗?或者只是使用大量聪明的算法分析?“

这种区别对这些系统正在解决的问题有很大的影响。大卫曼说:“有些机器学习的东西可以容忍小规模的故障,比如汽车缓存中的比特翻转。”“到现在为止,你可能会认为我们已经知道该怎么做了。我们没有。但现在的情况是爆炸性的,这将是电子行业非常有趣的时期。”

对于AI/ML设计,挑战才刚刚开始。

有关的
确保AI / ML在测试系统中工作
AI拥有提高可靠性的承担,但它尚不完美。
AI的新用途
电力和性能的巨大进步源于低水平的智力。
如何测量ML模型准确性
对一个应用程序足够好的东西可能对另一个应用程序不够。
验证信息物理系统的重大挑战
表格的专家:模型和标准罕见且不足,使得难以考虑硬件软件和系统级交互和物理效果。



留下一个回复


(注意:此名称将被公开显示)