中文 英语

卷积神经网络前方的力量

采用这种机器学习方法的图像识别增长;其他应用程序需要性能和性能改进。

人气

虽然该术语可能不立即识别,但卷积神经网络(CNNS)已经是我们日常生活的一部分 - 而且预计在不久的将来会变得更加重要。

卷积神经网络是一种机器学习的形式,以大脑视觉皮层区分不同物体的方式为模型。这有助于解释为什么今天最常用的是图像识别,这是这个市场获得真正的牵引力今天。但它也有许多潜在的用途,远远超过图像识别,因为功耗降低和性能提高。

Facebook、雅虎或谷歌等网站试图从人们上传的照片中找到你,这在很大程度上已经通过神经网络完成了超声他指出,驾驶员辅助系统也使用了类似的技术。“认出人行横道上的人或你即将撞上的灯柱,这都是一回事。”一般来说,计算机视觉对于这些东西来说是一个巨大的领域,这也是一些最令人印象深刻的结果已经显示出来的地方,因为人们已经在这个领域做了大量的工作。在计算机视觉领域,有很多的工作都是尝试用传统的算法来做计算机视觉人们开始把cnn应用到这些计算机视觉问题上。他们用这么少的努力得到了更好的结果,这改变了cnn的看法。突然间,它们看起来像是解决这些问题的一种实用方法,而以前它们从未考虑过这些问题。他们总是在寻找问题的解决方案。”

那么这项技术还能做什么呢?Mike Thompson, DesignWare ARC处理器产品营销高级经理Synopsys对此说,该公司正在寻求将CNN技术推动到市场上更广泛的使用情况。关键障碍在保持性能级别目标的同时显着降低功耗。适用于视野,特别是对于汽车空间以及监视,通用物体检测和增强现实。

对于试图为强烈的计算活动选择合适的处理器的工程团队,维护不牺牲性能或权力所需的功能是游戏的名称。这是CNN闪耀的地方。

史蒂夫·罗迪,IP集团的高级产品线集团总监韵律,已经看到CNN在去年左右迅速发展并爆炸 - 它们似乎具有显着的持续力量。

在Synopsys的嵌入式视觉子系统的R&D主任PierrePaulin,同意CNNS在尖锐向上轨迹。他说,他两年前谈到的一半顾客询问了CNNS,但现在这个数字更接近95%。“在汽车空间中,它相对较新,但有些关键公司已经投资了这个空间并用它制造了产品,我们看到这一点是在汽车空间中的发生。为什么CNNS非常受欢迎的另一个关键方面是您可以为任何事情训练它们。在过去,您必须对行人或四辆汽车进行专用特征检测,每个人都开发了自己的特色检测,这是定制的。“

什么是cnn?
罗迪将CNN定义为“以结构化时尚的蛮力猜测”。“人们长期表示,如果您有100万猴子,100万打字机和100万年,则可以生产莎士比亚的作品。这有点像那样。“

CNN不是新的。第一个神经网络计算产品30年前出现了晶片机还有其他几个收缩系统的东西,罗迪指出。“人们说我们能在几年内复制人类大脑。当然,它没有发生。它褪色,有些感觉它会回来。现实是您有此类大规模计算马力。“

他说:“cnn的概念是训练和部署,这是两个完全不同的步骤。“部署是显而易见的,比如当你有一个特定的网络,一系列的计算,所有本质上过滤和抽取数据。例如,你拍了一张3000万像素的巨大图像,然后销毁所有数据,得到的答案是1或0,1表示‘是的,我认出它了,这是一只猫的脸’或‘不,它不是。“从计算上讲,这都是重型DSP。它是一个非常受计算限制的DSP,所以它正好是我们的专长,在爆炸方面——两个数量级的计算。人们需要以一种节能的方式来做。但真正让它成为可能的是,现在有了拥有上百万处理器的数据中心的亚马逊网络服务。”

CNN所遵循的基本模型是神经系统模型。

“如果你有100万只猴子,100万台打字机,100万年的时间,你就可以创作出莎士比亚的作品。”

“它具有两种有趣的特性,可以大规模平行且高度连接,但是由于大部分连接而不是使用的扭曲,”Wayard解释说。“可以使用多少限制,但是学习算法已经建立了一组权重,并且可以附加到给定神经元的突触的数量基本上是无限的。但是,您对突触上的每个信号给予的重量是高度变化的,并且一旦您获得太近零,突触就不会改变神经元的行为。这就是让它如此有趣。如果将其与其他大规模并行的事物进行比较 - 矩阵乘以和东西,那么一切都将乘以其他一切 - 您可以构建有效使用的这些阵列。但在CNN背景下,它并不是那种方式,因为许多系数是零的。建立足够的沟通来完成所有不用的沟通并不是很好。这使得从架构的角度来看,尝试确定最佳方式,将这个概念映射到的最佳硬件架构是什么。“

为什么是现在?
工程团队永远都在为他们的用例选择正确的处理器,在不影响性能或性能的情况下维护功能是最重要的。cnn符合这一要求,而且使用起来更容易。

“cnn走红的原因是,它有效地表明,你不需要编写程序来进行复杂的模式识别,”罗迪说。“挑战在于高端模式分析识别——无论是在布鲁塞尔所有地铁摄像头上搜索那张特定的脸,还是在你走到前门时验证你的脸,它会自动为你开门。”或者你的汽车上的四个摄像头以每小时70英里的速度在高速公路上以每秒60帧的速度拍摄高分辨率视频试图找出其他汽车在哪里,车道在哪里,以及速度标志显示了什么。这是一个巨大的计算,但没有多少人同时拥有图像科学背景和非常好的嵌入式编程技能。为了解决像汽车上的ADAS这样的问题——我想在高速公路上狂奔,识别交通标志,并以一种高效的方式做到这一点——你必须找一群有图像科学背景的人。这是维恩图的一部分。其他重叠的部分将是那些拥有良好嵌入式GPU或DSP编码技能的人。你在寻找这两者的重叠之处。它不是很大。”

他指出,培训方面不一定涉及写任何代码。因此,您可以采取已知数据的数据库数据 - 街道的100万图像,猫的照片与100万张图片,100万乳房照片,以及您的标签,哪些是癌症,哪些是癌症,哪些是癌症的标签。“基本上,您可以启动这些数据中心之一,这些培训计划启动了许多候选潜在目标,并一次猜测数小时小时数。然后,您实现了这组随机生成的计算集,这比任何人都有100个都会用手写入的任何组成,恰好在乳房X光线照片中做得更好,而不是最好的25年训练有素的放射科医师。基本上绕过了整个瓶颈,没有足够的程序员,在域成像或股票交易模式和计算机技能之间的重叠技能。你给它数据,告诉它结果,并告诉它找到模式。您有点释放来自需要了解如何编程和代码的数据的所有者。对于驱动巨大的音量 - 可以看到它们的巨大手机的东西,可以看到它们的汽车 - 让这些东西运行所需的马力的数量只是巨大的。“

这也可用于分析从股票交易模式到销售汽车以与谷歌眼镜进行自动翻译的大数据分析。它恰好发生的是,一个部署的第一个也是最明显的地方是可视识别。

例如,来自汽车行业的规范指出这样一个事实,即计算往往是8位甚至6位的,因为数据总是在被破坏。

“你正在服用高分辨率的图像,以及你所做的第一件事就是开始快速地扔掉数据,以便能够将其减少到快速答案:是人行道上的奶奶而不是在人行横道上?”罗迪说。“是还是不是?在可预见的未来[意思是两到四年]计算实现这些CNN的胃口几乎是无限的。这就像GPU人或DSP人员甚至是CPU人员才能突然出现更多的马力,因为突然出现了更多的问题,解决了解决方案。你实际上可以想到拥有五个正在围绕汽车寻找威胁的摄像头。“

这可用于分析从股票交易模式到销售汽车的大数据分析,以用谷歌眼镜自动翻译。

这意味着从电力角度来看,即使是GPU的最新和最大的GPU技术,它在大约270瓦特上运行,在混合动力汽车中运行ADAS应用,例如,需要专门的硬件来实现这一目标。在这种用例中,270瓦是不可接受的。“比赛与DSP供应商和GPU供应商等讨论了我们如何将270瓦特下降到2.7瓦,因为几个瓦特很容易展开,”他说。

随着研究人员对cnn的实际工作原理了解的越来越多,算法也在不断进化,以将循环次数减半,同时保持与之前最佳结果的误差在1%以内。突破性进展每季度报告一次,有时每月报告一次。

Wayard指出,如果它正在大规模平行,则存在许多在这些问题上投掷计算权的方法。“您需要始终小心计算和通信之间的比率。It lends itself relatively well to local computation and relatively controlled distance communication, so that’s good from a power perspective but you’re talking about doing lots and lots of operations and the reason it’s fast is because they can be done in parallel but any way you slice it you’re doing a lot of work so you have to worry about it more. That means the architecture you pick matters.”

尽可能降低权力对于这些类型的应用程序给定的加工需要,Synopsys对此”汤普森说,“如果你看看这样做与GPU例如你谈论瓦的功率和大量的应用不容许我们有建立一个专用的IP CNN引擎是完全可编程。它的美妙之处在于,它让我们可以用一种结构来实现CNN,这种结构在功耗方面与直接硬件非常接近,但它是完全可编程的,可以用于更广泛的范围。

建筑事项
对于处理器来说,这么大地归结为架构。对于CNN,它是相同的。Wayard对CNNS说,从许多有利地点看。“网络的创建是培训过程,您试图弄清楚的是与所有突触相关联的系数。这意味着您不知道正在使用多少连接。因此,您可能想要使用的架构可能看起来与您使用的内容培训,并且您只需尝试运行大量的网络验证的网络。“

他说,现在主要的培训方法是使用图形处理器阵列。“出于良好和合理的原因,gpu拥有非常强大的内部通信路径,很明显,它们拥有非常大规模的并行单元,擅长做算术。因此,一旦网络经过训练,这是一个非常好的匹配。”

培训过程是新架构有很多机会。关于培训是否常常足以让这是一个非常关键的阶段,有一个有趣的问题。“现在,人们使用传统的计算机做大部分工作,并且如果他们有一些专业的架构,它需要的时间更长,但它们不经常这样做。现在我们进入真正的应用问题,这是我们需要重新培训的频率,导致我们恢复的情况是什么,以及大脑模型是什么。我们想认为我们的大脑总是学习,总是训练。“

cnn的这种学习现在正在进行,所以今天的解决方案可能在一年内很快就过时了。这就是为什么今天的供应商正在采用可编程的方法,相信在未来会有更多的关注这方面。

资源
嵌入式神经网络峰会

相关案例
在AI和深度学习中
内神经形态计算
神经形态芯片Biz升温
五个问题:杰夫·比尔



发表评论


(注意:此名称将被公开显示)