科技网

当前位置: 首页 >智能

百度阿里腾讯进入语音辨认这家创业公司压宝

智能
来源: 作者: 2019-05-17 02:03:06

浙江绍兴首次测评网购商品大多质量不合格
超极本售价居高不下变超级难卖
支付宝未来医院这一年改变了什么

云知声CEO黄伟

2016年3月,围棋人工智能程序AlphaGo击败李世石,再次引发人工智能关注热潮。 坐了10几年冷板凳 的云知声CEO黄伟,顺着物联兴起的兆头,也许迎来语音识别最好的发展时机。

2003年前后,这个行业曾经经历过一次高潮,因为语音识别实验室识别精确度到达90%以上水平,大小公司蜂拥而至。2005年全球领先的语音识别公司Nuance上市,市值最高突破90亿美元。2008年,科大讯飞(002230)上市,国内市场占有率一度占到70%以上。

但是,只有极少数公司在这1波浪潮里突出重围。语音辨认在实际使用场景精确度降到很低,短时间内技术解决基本无望。大公司纷纷关闭语音识别相关部门,热潮不过昙花一现。

平台化实现弯道超车

移动互联的兴起、机器深度学习(AlphaGo的主要工作原理)的发展,让语音识别再次出现上升之势。苹果2亿美元收购Siri Inc.公司,2011年发布Siri语音助手。同年,谷歌连续收购语音通信公司SayNow和语音合成公司Phonetic Arts,亚马逊收购语音辨认公司Yap。

2012年6月,梁家恩创立云知声。这个时候,科大讯飞已经在国内语音辨认市场筑起了深厚的壁垒。要想实现弯道超车,梁家恩想得很清楚:第一是算法;第二是数据。如果算法是引擎,那末数据就是燃料。哪怕算法得到极大提升,如果没有油的话,车还是跑不起来。

左起:云知声董事长兼CTO梁家恩、云知声CEO黄伟

梁家恩决定做开发者平台。对一家创业公司而言,平台包袱无疑很重,团队也有过纠结。 我们必须把平台先做起来,让市场看到云知声的能力。 语音辨认技术最关键的是先要有充足的语料积累,不光是找人去录语音,更需要用户真实的数据。而做平台能够在短时间内完成大量的语音数据积累,以实现弯道超车。

淘宝上买机器、普通游戏显卡,10个人不到的工程师团队,自学深度学习算法,3个月平台上线。

没有人想到这样一家刚成立的小公司真的能做出来。 云知声董事长兼CTO梁家恩现在说起来还颇为得意。2012年9月云知声发布的语音平台,当时精确度只能做到85%,如果真正应用到实际场景,甚至会降到60%。到2013年底,语音数据已从最开始的800小时积累到3000小时,精确度提高到95%,平台上的开发者大大小小已有8000多家。4年以来,云知声开发者平台每年保持400%的增长量,目前每天调用量在1.5亿到2亿次之间。

平台也打出了云知声的名气,语音辨认技术在人工智能领域相对成熟,这家公司开始考虑商业化。一开始,他们就选择了从B端切入。云知声CEO黄伟始终认为,在人工智能领域,B2C在中国很难实现,这也是黄伟一直坚持不做单品的原因。

和搜狗合作,云知声一战成名。

当时搜狗和百度都在抢时间点,想率先发布语音助手。但搜狗本身并没有这部分技术,将市场上各家的产品一一测试,综合价格因素,一周时间便与云知声达成合作。

小i机器人(300024)也是云知声初期的客户。对方给银行提供服务,之前都是文本,后来逐渐拓展到语音领域。科大讯飞是它当时的服务提供商,收费很高,小i机器人便找到云知声。云知声以相对低的价格拿下客户。

黄伟说: 在市场、技术不成熟的前提下,过高的使用门坎无疑是杀鸡取卵。

和乐视的合作,除技术上的相对优势以外,乐视当时也处于起步阶段,而科大讯飞更愿意围绕运营商来提供服务。当乐视自身尚没有证明自己能力时,科大讯飞相对是守旧的,这就给了云知声机会。

云知声早期合作公司多为互联公司,他们更勇于尝试新的东西,快速迭代。传统公司相对守旧,除了产品本身好坏,出身等其他因素也会被纳入考量。

在云知声规模还很小的时候,对于客户而言,如果选择大厂商,出了问题是大厂商的。但如果选了云知声,出问题的话,决策者自己需负很大。 黄伟告诉 。

2013年初,先后供职摩托罗拉中国研究中心、Nuance,一手创建盛大语音创新院的黄伟加入云知声,担任CEO。 从读书的时候开始,以后10年工作,我终究等到一个可以放手去做这件事情的机会。 黄伟穿着深绿色衬衣,牛仔裤,戴着无框眼镜,头发抓得一丝不苟。谈话之间偶尔取下手段上的佛珠拨弄。

商业上的技能我们确切吃过很多亏,我们不是商务驱动型的公司,最开始就是拿产品过去,实打实地测试,比识别率、比响应速度等。

差异化赢得时间

云知声IoT事业部副总裁康恒说: 平台给云知声带来的另一个收获,我们得以发现市场所聚焦的需求。通过不同行业用户在平台上的使用频度,能够精准捕获市场需求。 车载、家居、医疗和教育,是云知声的四大重点领域。

2014年,市场上已有汽车厂商将安卓系统和车载设备相结合,黄伟隐约看到车联的兴起之势。很快,云知声成立专门的车载语音技术团队。

从整个车载语音设备行业来看,前装市场规模大,但产品周期长,且科大讯飞深耕已久。后装市场满足用户购车后的个性化需求,市场规模小,但少有入局者。

当时的后装市场鱼龙混杂,大大小小的厂商遍地都是,质量良莠不齐。黄伟也是摸着石头过河,只能一再谨慎,尽量选择优质厂商合作,采取统一授权以减小风险。

截至2016年上半年,云知声车载行业的产品激活量近两百万台,收入规模达千万级别。

智能家居是云知声的又一重镇。

随着物联概念的兴起,几乎所有的家居厂商都在探索智能家居的未来。语音识别在智能上的应用并不是刚需,触摸已能够解决大部分的应用场景。对鲜少拥有触控屏幕的家居产品,语音交互很快成为厂商间的共识。

早在2014年,云知声和一些家电巨头就有过接触,但先期落地的产品主要集中在创业公司。这些创业公司希望“模特外公”女装LOOK 老年人也是时尚界的弄潮儿!
生产一些智能化的产品,虽然量都不大,云知声技术团队仍全力配合开发,不断试错,打磨技术。

2015年,我们在家居行业的策略是和小公司玩;从2016年起,我们也要和巨头共舞。 黄伟说。

美的一直看重智能家居,尤其空调这个单品,从2012年起便不断寻找智能化解决方案,和科大讯飞、韩国Powervoice都有过合作。

2014年底,云知声开始和美的接触。对方要求明确:第一、用户直接通过语音方式控制空调,且不受噪声影响;第二、一定距离的远场语音交互得以实现;第三、方案成熟,成本控制。

远场语音交互是关键中的关键。

当时市场上普遍解决方案都是八个麦克风收音,虽然语音识别准度得以提高;但能耗、安装等问题却接踵而来。

云知声团队做了大量先期工作,发现像空调这类产品,它永远都是贴墙放,八个麦克风在实际应用上是多余的。云知声提出双麦克技术,两个麦克风间距不过三厘米,在任何产品上都可自然适配,即插即用。

一下少了六个麦克风,如何保证远场语音交互能达到测试要求,云知声花了一年半来解决这个问题,2015年底投入生产。

2016年8月1日,美的智能语音空调正式发布。

从2015年开始,云知声涉足医疗领域。2013年前后,云知声就想往医疗方向发展,初步接触下来,当时的时间点太早,需求尚没有爆发。

语音识别在人工智能各领域中虽然相对成熟,但远没有到顶。除高度的提升,广度则是所有语音辨认厂商需要发力的领域:比如特定行业的语音识别、歌曲识别、方言辨认等。像之前上语音辨认精确度能到达96%,当落实到和医院合作时,精确度急剧降到60%左右。

云知声销售杨拓刚开始做医疗客户时,也很不适应:医学里有大量专业术语,在日常生活中是鲜少应用。如何保证系统知识库既能准确识别日常对话交流,同时又能对这些专业术语进行分辨,平衡很重要。

当时客户需求反应过来,团队马上根据不同科室,短时间内人力搜集专业信息,同时辅以机器学习,通过大量医疗数据积累推动算法提升。经过跟医院场景和医学术语的深度定制,语音识别的精确度提升至95%,部分科室经过优化到达98%。

2015年底,云知声的语音识别服务在北京协和医院四个科室上线使用,2016年起全院推行。 最开始我们确实会选择一些相对竞争不那么充分的领域先行切入,但我们不会为了躲避竞争,而选择一些根本不存在的市场。 黄伟说。

Nuance在医疗市场,光美国一个国家的年收入就接近20亿美元。

押宝芯片深耕物联

2015年,亚马逊推出家用智能音响Echo,被视为目前语音识别领域最出色的实体产品,依托亚马逊平台,2016年上半年,出货量300万台。

微软推出小冰,百度将语音团队独立,阿里巴巴将语音识别技术全面应用在阿里云系统上,腾讯智能语音服务系统也上线。

可视对讲系统

这一波人工智能热潮里,巨头们纷纷入场。

黄伟相信语音交互一定是人机交互最自然的形态。前端语音交互提供入口,后端互联提供服务。只有二者充分的结合,才能为用户带来更多价值。

而 云端芯 则是在这一轮语音交互竞争中黄伟的希望所在:云是线上平台,沉淀大量基础数据;端最开始是智能,现在已全面向物联迁移;芯片则是云知声所有技术和服务的载体。

早在2014年底,云知声完成来自高通的5000万美元B轮融资后,便开始发力芯片领域。对于物联而言,终端对功耗非常敏感,市场上现有芯片常常搭载很多不必要的功能,标准程度、稳定性达不到要求。

芯片的设计、制作困难重重。云知声之前和一家公司合作,当时在产品部门测试全部通过,结果到了工厂,实际操作中不适配。工厂的生产是有排期的,如果一定时间内不能测试通过投入生产的话,整个产品线都要延期。对方给了两天时间,云知声的工程师直接驻厂,一边不断调试一边和对方沟通。

现在,云知声与高通合作的特殊芯片,功能集中,能耗剧降,适配程度大幅提高。

2007年,第一代iPhone推出,接下来近十年里,移动互联风生水起。随着智能普及率提升,2016年智能全球出货量增长几近停滞,根据市场研究公司Strategy Analytics数据,全球智能出货量2016年2季度为3.404亿部,相比于2015年同期的3.38亿部,仅增加了1%。

那移动互联之后呢?

物联将是一个比移动互联更伟大的时期。 黄伟告诉 。

目前云知声几乎将全部资源押宝物联布局,智能家居、车联、智慧医疗和教育四大领域,合作客户近两万家。他认为云知声的未来将是物联领域内一家优秀的人工智能服务公司,让机器更好地理解用户,交互变得自然而智能。

我希望它会成为万物互联之下的BAT。

小儿积食
布丁面包块
1219788.html" target="_blank">宝宝晚上睡觉出汗是怎么回事
婴儿手心出汗

相关推荐