中文 英语

在晶圆厂使用人工智能的应用和挑战

深入学习和数字双胞胎可以帮助识别模式,最终可能能够解决出现的任何问题,但它需要一段时间。

人气

表演专家:半导体工程坐下来讨论筹码缩放,晶体德赢娱乐网站【官方平台】管,新架构和杰里·陈的包装,为NVIDIA的制造业和工业制造业的全球业务开发负责人;David Fried,计算产品副总裁林研究所;Mark Shirey,营销和应用副总裁克拉;和Aki Fujimura,首席执行官D2S.。以下是谈话摘录。要查看此讨论的第一部分,请单击这里

SE:机器学习是一个热门话题。该技术使用神经网络来攻击数据并识别模式,然后匹配某些模式并了解哪些属性是重要的。为什么芯片制造是如此重要?

:我将最近的进展区分了区分深度学习的子集机器学习。反过来,机器学习通常被称为一个子集人工智能。机器学习技术早在20世纪90年代甚至更早的时候就开始被使用了。其中一些技术是人工智能。其中一些是深度学习的先驱。其中一些是软件算法,我个人认为并不是真正的人工智能。我认为深度学习是不同的。当我在20世纪70年代和80年代作为一名人工智能学生去上学时,已经有顶尖的人工智能计算机科学家试图编写一个可以打败象棋大师的程序。他们一直在尝试,但直到最近10年,通过深度学习,这才成为可能。

SE:这是什么影响?

有些事情只有非深度学习是不可能实现的,但现在通过深度学习可以实现。有了gpu加速的深度学习,我们就能看到一个可以经常打败象棋大师的程序。这是关键的区别。与此同时,在D2S的电子制造深度学习中心(CDLe),我们正在探索如何在半导体制造领域发挥同样的作用。虽然我们还没有达到同样的实现水平,但深度学习显然将能够完成非深度机器学习或任何其他软件技术在过去无法完成的事情。在我们的探索中,我们已经在半导体制造领域开展了20多个深度学习项目,特别是掩模制造、晶圆设计、FPGA设计和PCB组装自动化。在所有这些不同的领域,我们都找到了非常有用的应用。这20个项目中有许多是可行性研究。他们进入了原型阶段,我们得到了很好的结果。特别是有三个项目目前正处于产品化的过程中。 They will be announced later this year or early next year. Deep learning, meanwhile, is a new compute model. I call it ‘useful waste.’ Basically, you choose not to worry about being selective about what you compute and what you don’t compute. You don’t say: ‘Let’s first figure out which things are worth computing and which things are not.’ That used to be the kind of computing we did. There were AI techniques like alpha pruning, which was exactly that. How can you minimize the amount of wasteful computing? That used to be the focus. What changed was computing with a GPU and other single-instruction multiple-data (SIMD) computing. SIMD including GPUs scale by bit-width rather than only by clock speed, and that’s the key. What happened as a result is that computing or processing really did become free. We could say, ‘Just let the machine do it.’ The machine is tireless. Let it compute for a week and come up with a neural network that works. And then, when you actually run it, it doesn’t take very long for what is called inferencing in deep learning terminology. Trying to figure out what your network looks like or how it is programmed, or parameterized, might take a long time, but who cares? Let it run with just brute-force computing. Then, when you use that parameterized network, the inferencing is fast. That model of computing became practical by leveraging the bit-width scaling of SIMD made economically feasible by GPUs. Deep learning techniques and neural network computing just happens to be particularly suitable for SIMD. That really is what broke a dam. I would predict that there would be other kinds of computing approaches that are not deep learning, but something else that’s also taking advantage of this useful waste kind of an approach.

:AI可以在不到10年前考虑大挑战的令人惊讶的事情。但最终,它只是另一个HPC(高性能计算)工作负载,具有独特的计算特性和其他任何其他工具。正如我们知道如何构建对图形和HPC都很棒的架构,我们也学会了如何为AI培训和推断构建伟大的架构。事实证明,所有这些工作负载都有很多架构杠杆。


图1.人工神经网络的简化视图。连接被建模为权重。在操作中,所有输入都由重量和总结进行修改。然后,激活功能控制输出的幅度。来源:维基百科

SE:曾经有一段时间,这个行业依靠纯物理来解决制造业和其他领域的问题。我们能继续用纯物理来解决这些问题吗,还是我们需要像机器学习这样的技术?

第一,基于原理的物理方法总是基础性的。但有时物理学还没有被完全理解,或者模拟它们的计算成本是不可能或不实际的。在这些情况下,研究人员开始使用一种混合方法,将基于物理的模型与人工智能模型结合起来,以获得这两个世界的最佳效果。这种混合方法将我们所理解的物理与测量数据所捕获的物理行为的数据驱动表示相结合。在制造操作中,这种方法帮助您弥合基于物理的模型预测的结果与传感器实际感知的结果之间的差距。光刻是一个很好的例子,这种方法变得非常有价值,因为你的过程窗口是如此敏感的建模错误。等式两边都有很多数据。物理驱动的方法和数据驱动的方法似乎都能在gpu上很好地工作。这是事情变得有趣的最佳点。

SE:半导体制造中机器学习的主要应用是什么?

Shirey说:机器学习的主要应用之一是缺陷检测和分类。第一步是使用机器学习来检测实际缺陷并忽略噪声。我们在从过程和模式变化的嘈杂背景中提取实际杀手缺陷信号时,我们正在看到许多机器学习更好的例子。第二步是利用机器学习来分类缺陷。这些日子的挑战是,当光学检查员以高灵敏度运行以捕获最微妙的,临界缺陷时,也检测到其他异常。首先将机器学习应用于检验结果,以优化发送审查的缺陷样本计划。然后,采用高分辨率SEM图像,并使用额外的机器学习来分析和分类缺陷,以便为Fab工程师提供关于缺陷种群可操作数据的准确信息来驱动过程决策。新兴的应用是利用机器学习更加预测检查和测量的位置。如果您可以聚合更多的Fab数据并构建相关性,那么您可以更聪明地了解检查。这可能是一种非常强大的解决方案,可以提高产量和延伸摩尔法经济学。

这些应用大都属于过程控制的范畴,但它本质上是对过程配方进行调整,以满足晶圆上的目标规格。它首先要改进晶圆对晶圆的控制和均匀性,并使用诸如蚀刻端点控制或气体流量调节等应用程序。每个晶圆片到达一个控制过程时的条件略有不同,这是基于之前的过程操作的变化,而过程设备根据其环境和所有之前的状态处于当前状态。如果设备可以自动调整配方参数,如终点时间或每个晶圆的气流,后处理晶圆的均匀性可以得到改善,预先存在的变化可以减少。这是一场重大的胜利。之后,你可以通过控制卡盘温度区等参数来改善晶圆间的均匀性。为了进行这些控制配方调整,您需要有数据来帮助监控过程结果对控制参数的敏感性,然后对这些关系建模并实现控制方案。

佳能(Canon)最近的一篇论文显示,至少在某晶圆厂进行了一项针对机器预测性维护的试验部署。加速所有类型的迭代优化程序,包括OPC/ILT(光学接近校正/反光刻技术)已被所有供应商广泛讨论。自动缺陷分类显然适合于深度学习。也有许多关于SEM图像处理的各个方面的论文,包括去噪、轮廓提取和来自许多来源的数字孪生。作为一个大趋势,我认为深度学习应用将在2021年进入生产部署阶段。让数字双胞胎能够随意生成训练数据,而不必实际制造所有情况,这是深度学习产品化的关键。

SE:机器学习的挑战是什么?它是否准确,是否能够获得足够的数据?噪音呢?

:准确性显然是不可谈判的。正如我之前提到的那样,过程窗口对建模错误非常敏感。而最好的AI模型正好工作,因为它们擅长从嘈杂数据中提取真正的信号。我们的行业有很多数据,以及许多技术人才。我的观点是,我们面前的最大挑战是将这些较新的数据驱动方法集成到生产工具和工作流程中。但行业领导者显然在机器学习和AI中积极投资,落后者却意识到这种趋势是不可避免的。

深度学习是一种相对较新的技术,所以在每个方面都有很多改进的机会。这在一定程度上推动了整个半导体行业的发展,加速了超级计算在各行各业的应用,而不仅仅是科学计算。对于基于深度学习的应用程序的生产部署,特别是在半导体制造领域,我们在CDLe的工作中发现,需要数字双胞胎。深度学习需要大量的数据。此外,深度学习程序员主要通过操作提供给网络的训练数据来改进深度学习应用程序。例如,如果一个深度学习的精度提高网络训练一只狗与一只猫被一种罕见的狗,程序员需要想出更多的这些类型的狗和猫的照片,看起来类似于狗和训练网络,说“这是一条狗”,这是一只猫的反复。当程序员意识到神经网络被什么弄糊涂时,训练过程需要随意添加数据。对于半导体制造应用来说,有一个基于模拟或基于深度学习的数字孪生是绝对必要的,可以随意生成假图片,这样程序员就不会因无法随意生成训练数据而受到阻碍。虽然一个有前途的深度学习应用的原型可以用10,000甚至1,000张图片创建,但生产部署需要数百万张。拥有一个数码双胞胎是获得所需的唯一途径。

Shirey说:自动化可以是劳动密集型的。今天,机器学习算法仍然需要用标记数据进行训练。关于检查,最初需要花费一些时间来建立分类的缺陷库。然而,一旦完成了这一点,算法就可以很好地工作在准确性和纯度方面,最终,通过生成更好的质量数据,它们减少了识别缺陷源和采取纠正措施所需的时间。看到今天的机器学习算法帮助构建未来的人工智能芯片是令人兴奋的,我们乐观地认为,无监督的机器学习应用将继续在半导体生态系统中增长。

使用四象限是看待这一挑战的正确方法。在机器学习的过程控制应用中,你有感知,然后是预测,优化和控制。在Lam研究中,我现在关注的是试图理解蚀刻反应堆或沉积反应堆中传感器的输出。我们试图根据传感器数据和配方信息预测晶圆片上的结果,优化这些结果以满足客户的要求,然后控制反应器以大批量生产这些晶圆片上的结果。这就是这四个步骤。为什么我不能用传统的方法,使用纯物理,来预测在我的反应堆或晶圆上发生了什么?我们可以使用纯物理,对于问题的一小部分,人们已经做了很多年了。但是,如果你只考虑一个蚀刻或沉积反应堆,有一些非常复杂的化学反应,等离子体物理和热效应,以及时间效应。对于每一个领域,你有50个不同的方程来描述物理,有大量的参数和许多未知数。你可以尝试从第一原理物理开始编写这些效果。 Unfortunately, it becomes basically an intractable task, because each of those equations reference one another, and producing an accurate solution becomes computationally very expensive. Then, there is the other end of the spectrum. If I say, ‘Forget the physics. Let me just use pure data and machine learning to model my reactor,’ I will use every parameter that I can control on my etch or deposition system and every recipe knob, and just use machine learning to predict what’s happening on the wafer. Unfortunately, the problem now becomes intractable for a different reason. If you look at the number of recipe controls (we call them ‘knobs’) on an etch or deposition reactor, and the number of possible recipe combinations, it’s in the e14 range. The point is that you’re never going to have enough data to predict the best recipe out of that many combinations. You’re never going to have enough data to use a pure data solution to understand the sensor data, predict the result, optimize that result, and then control the result. Fortunately, there is a realm in between using just pure physics or just machine learning. That’s where it’s really interesting, and where you’re coupling constraining physics with some of these data science techniques like machine learning, neural networks and deep learning. The data science is still emerging, but the computing power needed to execute these data science techniques is now nearly free. We’re starting to reach this valuable region in the middle, where you can start to combine physical governing equations to data science techniques. Using this technique, you can decrease the data requirements needed for an accurate solution. You also can start to increase the probability of solving these problems with sufficient accuracy at a computational cost that’s reasonable in that middle range. And that’s where the gold rush is right now. It’s where you join an understanding of the underlying physics with advanced computing techniques. We’ve built and have the software, the computing power, and the data science techniques to reach that region in the middle part of the spectrum between pure physics and data science. That’s the most interesting part of our business today.

SE:在最近的SPIE先进光刻会议上,来自NVIDIA的扬声器列出了FAB和面具商店中的深度学习的几种应用,例如自动缺陷分类,OPC修复,模型精度,路径和光刻造型。这一切都在哪里?

我们开始将这些技术整合到我们自己的工具中,从而设计出更好的设备。我们也相信这些技术可以帮助我们优化我们的设计性能和可制造性,这当然有利于我们和我们的铸造合作伙伴。我们已经看到了一些成果,无论是在设计方面还是在制造方面。

有关的故事

在晶圆厂的Ai接下来是什么?

如何以及何地在IC制造中使用

在工厂可以做什么机器学习

用机器学习发现芯片的缺陷



发表评论


(注:此名称将公开显示)