新闻是有分量的

新葡京国际娱乐

2019-05-01 10:34栏目:新闻

原标题:语音云平台为什么要做全栈?

(点击图片参加2019人工智能产业独角兽评选)

本文大概

5000

10

分钟

导读:2012年,我们曾经很天真地认为只要我们把语音识别做好就可以了。很多人也跟我讲,你们就专注去做语音识别,把语音识别做到业界No.1。如果当时我们听了这个建议,云知声现在已经挂了。

文:文姜

语音技术是巨头开启的赛道。

创业公司看到机会,开始投身于此,比如云知声。2009年、2010年,苹果、Google开始在语音上发力,并先后推出了产品Siri和Google Now。

2011年,云知声董事长兼CTO梁家恩、COO康恒两人认真研究过Siri后,发现凭借自己的技术能力,可以做出比Siri和Google Now更好的产品,而且更具中文优势。再加上政府、金融对语音需求日益壮大。他们便谋划创业。这是云知声创立之前的故事。

今年3月底,梁家恩站在台上感慨,“成立七年,到今天为止,云知声才有底气说要开一场真正好的发布会。”据悉,这是云知声第一次举办了open day,向外界展示自身的技术和在产业里的实践。

他的话道出在巨头赛道里创业的艰难与紧迫,窗口期有限,每一个抉择都事关生死。云知声CEO黄伟在一次分享中提到,“在市场里,创业公司要么占一个垂直领域,要么在技术链条上下苦工。前者,或许你的技术宽度不够宽,但是在场景里面扎得足够深,你可以活。后者,十八般武艺你都会,你可能活得更久一点。”

以下是云知声的技术探索,也是7年学习 “十八般武艺”的阶段性展示。7年,云知声从语音识别技术切入,拓展到语义、对话,从对话拓展到针对具体场景的服务,从语言识别的单一技术到构建了全栈的技术闭环。

云知声的AI核心:全栈和硬核

阿法狗战胜李世石后,AI概念被炒得火热。所有不被人们熟悉、理解的计算技术,现在被通被称为AI。

梁家恩认为,“真AI和伪AI公司不仅在技术实力上的差距,还体现在对产业问题的态度上。AI是一种技术,假如它不跟产业结合的话,是一种纯粹的炫技。

梁家恩在云知声open day演讲

在产业里,还有太多的问题没有得到有效解决,我们在技术端还有非常大的挑战 。AI重要的是解决产业的实际问题,只有把利用AI技术解决掉问题,我们才说这个产业的春天真正的到来,否则的话就是一个泡沫的阶段。”

如何利用技术切入产业场景上,云知声给出了两个关键词,第一是全栈,第二是硬核。“全栈让我们关注用户价值和应用问题,硬核帮助我们破解产业难题。”

“全栈”也意味着,掌握语音识别全链条的技术,从前端、后端到芯片端。“打通一个完整的产业闭环,把感知和表达的技术,真正跟认知结合,把底层打通。”

做语音云平台,也必然要求云知声要做全栈的技术。语言平台的核心技术链条很长,它包括麦克风阵列、语音识别、自然语言处理、语音合成等,但行业的产品大多需要全链条的技术。

技术链条长就意味着当平台某一项技术不能满足开发者的需求时,开发者需要单独开发全链条技术。

例如说,某个用户说一句话,怎么去除噪音,怎么识别、理解这句话,理解后又如何做聚合,这是一个闭环。用户用的是整个交互链条,如果这个闭环缺失了某一部分是需要开发者自己单独开发的,因此,开发者对平台选择显得格外谨慎。

云知声是从语音交互起家的,迄今为止云知声的技术图谱已经超过了语音能力范围,包括感知和认知和表达能力,视觉和听觉、降噪和语音识别、对话管理系统、行业智能系统、人脸和语音合成。