中文 英语

Babblelabs:深度学习语音处理

启动将深度学习技术应用于高级语音处理。

受欢迎程度

发音为“babble labs”的初创公司是连续创业家的创意,该公司正着手改造语音处理,并将利用深度学习来实现这一目标。

Babblelabs的首席执行官Rowen已经发言了一些时间关于处理到更通用的硬件的处理,其中应用程序在上面分层,因此他的下一个启动是朝着这个方向的下一个启动并不那么令人惊讶。(编者注意:当这个故事于2018年1月首次发布这个故事时,初创公司的名字是拼写的Babblabs。我们更新了拼写。)

Chris Rowen, Babblelabs首席执行官
来源:Babblelabs

“深度学习革命引发了一场非常重要且相当迅速的能力进化,它使语音迅速成为计算机系统接口的基本方法之一。你可以从这些波浪中看出来。当我们有了基于键盘的PC,然后我们成长为Windows和鼠标。然后我们长大到云来捕捉和显示信息,并显示和触摸屏的手机和更多的视觉信息,但我们并没有取得非常的进步在输入端,所以大部分的电流,例如在汽车非常现实的危机。部分原因我们渴望搬到自主汽车不仅仅是人们不擅长驾驶,但人们使用历史接口像手机的屏幕真的很危险,驾驶变得更危险,它的部分原因自动车辆已经变得如此重要,“他解释说。

“语言对我们来说是一个非常重要的界面,”他继续说,“我们确实经常说话。在一个全球化的世界里,我们与人交谈,与服务,他们是很远的,所以我们的电子设备是非常重要的。当我们处理语言的这种新兴技术取得突破时,就会创造出大量的新机会。”

“Babblelabs想要在这开花的前沿的言论在所有这些方面都在帮助改善人际沟通,当然在人类机器接口,我们正在逐渐了解和爱在语音识别和语音合成和其他类型的语音处理,“再生草断言。

但他承认,这是一个困难的问题。

就产品路线图而言,它仍然是早期的,所以Babblelabs还没有特别谈论产品。“我们非常仍然是在将导致产品的技术的规划和原型阶段。我们在音频处理和嵌入式处理中经验丰富,以及作为Tensilica的Cofounder的Dror Maydan的关键符号,并耗尽了所有软件开发,Tensilica在整个历史上的所有软件工具,以及作为领导者architect for Tensilica’s audio DSPs so he really mastered both the hardware and the software dimensions and has been at the heart of deploying billions of units of audio processing, in which speech processing is pretty prominent.”

Rowen和Maydan有很长一段历史,在Tensilica成立之前,他们曾在Silicon Graphics共事,而且他们还有一个共同的博士导师——斯坦福大学的John Hennessy。

目前,Babblelabls还没有设定对特定产品的期望,正如Rowen解释的那样,他们在集中精力研究技术的过程中学习了很多东西。“然而,很明显,这类软件在云计算和嵌入式设备中都有机会,我们显然将开发服务于这两方面的产品。与云产品相比,嵌入式产品存在不同的问题。云产品需要非常敏捷,并支持非常广泛的不同用途,因为云的优势在于它是如此敏捷。嵌入式当然意味着你必须很多关注实现:你如何让它足够低兆赫,足够低的计算,足够小的足迹,足够低延迟,你可以充分利用交互性既可能在许多有趣的使用情况下,强制性的让一个好产品。在处理云计算时存在所有这些自然的延迟,这既是一个好处,也是一个问题。从某种意义上说,这是一个好处,你可以专注于功能,你不能太担心每一个最后周期的细节,因为这样做有很多开销。另一方面,你有如此大的灵活性,你可以移动得更快;您可以将其部署到服务于不同用户的产品中,速度要快得多,如果您从经验中学到一些东西,您可以在几周后再对该产品进行改进。而当你思考的东西会进入一辆汽车或一个电话,你必须从不同的角度去思考关于开发过程,更新过程,你必须把事情真正正确的使他们变得非常积分平台的经验。 Particularly in something like speech, people gravitate to speech because it is such a natural interface for them, but it means that the experience has to be all the more seamless because the expectations are high. In fact, it is really kind of ironic that in the use of some of the other interfaces like touchscreens and the like, we have really trained our brains to fit those interfaces, and have made it work that way but it actually takes a fair amount of effort to do that. When you go to speech, the biggest motivation for it is that we already know how to do that. We want it to be as invisible an interface as possible, and that puts a really high demand on the quality of the sound, the flexibility of the language, which you can use, and latency—the responsiveness that comes of it. Those are fairly demanding aspects. Nevertheless, we see both cloud deployments and embedded deployments as an essential part of the vision of products that we will develop.”

Babblelabs还与合作伙伴交谈,潜在的长期客户有关现在正在成为言论的态度,并谈论使用案例是什么,以及使用案例的语音相关问题有什么人士在云中具有语言。汽车的驾驶舱是什么样的?手机电话中您要想要的东西是什么?在手机用户界面中?我们如何找到与IOT相关的最有趣和最有价值的案件,并且肯定有一些非常有趣的案件。

“当你考虑甚至小于质量的少量改善或言语的可理解性时,可以挽救生命。我认为这很重要,“罗登补充道。

Babblelabs最近关闭了由Cognite Ventures领导的400万美元的种子系列投资,杰里杨的额外资金支持,AME云风险企业的创始合伙人以及行业大师John Hennessy,Harvey Jones,James Hogan和Kurt Keutzer。



留下一个回复


(注意:此名称将公开显示)