智能音箱“风口”背后:技术与生态之争才是根本

作者:孙永杰 责任编辑:孟月 2017.07.21 09:17 来源:通信世界全媒体

通信世界网消息(CWW)根据ABI Research在2016年发布的预测报告指出,到2022年,支持语音控制的装置出货量将达到7500万台,其中智能喇叭/数位语音助理预计达到4700万台,预计智能音箱销售量将会逐步上升,未来3年内还将保持50%以上的复合增速。

1500599993360093940.jpg

语音识别技术是核心 挑战犹存

众所周知,目前全球巨头亚马逊的Echo、谷歌的Google Home、微软的Invoke表面上看是智能音箱,实际上各自背后的语音识别技术才是决定产品体验的关键。目前在语音识别市场的重磅玩家有苹果的Siri、亚马逊的Alexa、谷歌的Google Now 和微软的 Cortana。

苹果的Siri最早集成在2011年发布的iOS 5系统中,提供有限的天气、信息查询等功能,虽然每一年苹果都会针对自然语音处理性能及功能进行改进,但从数据看,人们使用Siri的频率并不高。而在苹果推出CarPlay车载系统后,Siri的地位被大大加强并逐渐凸显价值,而今年,Siri不仅开始支持第三方应用,还来到了MacOS上。

多年来,Google Now一直承担谷歌语音助手服务的重任,与Siri不同的是,它看上去更像是谷歌搜索的延伸。通过用户定制卡片,可以即时显示用户关心的内容,如新闻、体育比赛、交通、天气等,并且进行一定的上下文联想通知。语音方面,它并不能像Siri那样拟人化地与人聊天,但可以精准地识别问题、提供广泛的搜索答案。显然,谷歌也认为Google Now的语音助手体验并不完整,所以才会推出全新的谷歌助手,广泛植入到更多应用、硬件设备中。

至于微软的Cortana,其最初集成在Windows Phone手机中,可以通过语音命令实现拨打电话、发送短信、做笔记、识别音乐等功能,但由于Windows Phone市场表现越来越差,所以基本上没有用户使用。随后,微软将其植入到Windows 10中,从硬件覆盖上来说无疑更广泛,目前全球至少有3.5亿台电脑运行Windows 10。感觉上,Windows 10版Cortana更像是Siri与Google Now的结合体,一方面它可以通过语音命名实现搜索、应用程序启动等功能,另外还具有一个文本输入框,可以在不方便语音的时候输入文字。

尽管上述巨头在语音识别技术上各有特色,但依然面临着共性的挑战。

首先是如何让语音识别技术熟悉不同的语言、口音和方言,这一点在中国市场体现得尤为明显。为了收集中国各地的方言数据,百度在今年春节期间启动一项营销计划,推出了方言对话项目。公司向用户承诺,如果他们为该项目做出贡献,今后便可使用自己的方言与百度展开互动。短短两周内,百度就录制了超过1000小时的方言数据。

其次语音识别技术如何在嘈杂的环境中识别语音指令——包括酒吧和体育场等人声鼎沸的环境。为此,微软在Xbox上部署了一款名为Voice Studio的应用,专门收集人们在玩游戏或看电影时的对话信息。为了吸引用户贡献自己在玩游戏过程中的对话内容,该公司为参与其中的用户提供了各种各样的奖励,包括点卡和游戏道具。该项目在巴西展开了大力推广,当地团队还在Xbox主页上着重推广这款应用。他们随后利用这些数据开发了巴西葡萄牙语版的Cortana语音助理,并于今年早些时候发布。

最后是自然语言理解。 许多围绕对话交互界面的突破都要追溯到自然语言处理的概念,这一技术近年来已经获得了足够充分的发展。因为我们不会有意识地以一种结构化的方式来理解语言,所以,用于从大规模的、非标签的数据中进行推理的新数据方法(比如深度学习)看起来非常适用于自然语言理解。这些技术极大提升了计算语言的能力,并且不需要具体对语言的原理进行编码。

技术诚可贵 开放生态价更高

除了上述产品背后的语音识别技术的比拼和挑战外,厂商竞逐智能音箱的目的各不相同,但究竟谁走得更远,也许目前最为成功的亚马逊会给业内诸多启示。

据eMarketer所发布的数据,在美国,搭载语音交互技术的智能音箱中,亚马逊占领了70.6%市场份额,谷歌则只占了23.8%,可以说亚马逊Echo在美国备受追捧,在2017年,销售数量将会超越1100万台,正是基于Echo的胜利,众多厂商热情拥抱亚马逊语音助手Alexa,以此来争夺智能家居入口。

其实,与智能音箱市场份额排名第一的Echo产品相比,它背后的Alexa价值更大。与苹果的Siri和谷歌的Google Now相比,Alexa并未局限在智能手机中。亚马逊还选择将其开放,这令Alexa更容易与其他产品集成,最新统计已经有15000个应用内置Alexa技术,小到家用灯泡,大到汽车。

对此,亚马逊CEO杰夫•贝佐斯曾表示,Alexa将成为公司在电商、亚马逊Prime和AWS云计算之外的第四大支柱。言下之意,智能语音技术将成为亚马逊在人工智能和物联网时代超越谷歌的杀手锏。从PC进入智能手机,谷歌曾取代微软的霸主。

由此看,与做一款单纯的智能硬件音箱相比,获得庞大的用户数据和掌握软件服务入口以及建设属于自己的核心生态,才是亚马逊的真正目的。马逊将Alexa平台的接口开放后,上万名开发者加入进来,基于Alexa开发出了12000余种功能和应用,用户使用率和使用粘度越来越高,Echo也越来越家庭中心化。所谓“螳螂捕蝉,黄雀在后”,对于亚马逊的Echo来说,开放生态就是那只“黄雀”。

BAT入局 技术与生态各有所长

提及生态,众所周知,在移动互联网时代,谷歌率先布局并推出了Android操作系统,目前已经是智能手机市场上使用比例最高的操作系统,成为了谷歌移动互联网生态中最重要的一环。谷歌通过在Android中加入Google Play应用市场,谷歌搜索引擎和Google Assistant等自家的其他产品,最终将Android成功打造成为了用户流量入口。

而Android之所以获得成功,离不开技术能力带来的用户体验和吸引众多开发者的生态构建能力,进入到人工智能的时代这两种能力同样不可缺少。那么问题来了,谁能够成为人工智能时代的新Android?尤其国内均已经发布了基于各自人工智能技术产品的BAT大佬们。

2017年1月,百度在CES现场推出了首款对话式人工智能操作系统DuerOS,同时宣布与智能陪伴公司小鱼在家达成深度战略合作;6月腾讯云峰会上,其发布了全新的智能语音系统“腾讯云小微”,包括硬件开放平台、Skill 开放平台、智能服务平台三部分,是一个集上下游软硬件产业链于一身的开放平台,致力于将智能语音应用于家庭、车载、运动以及更广泛的场景中;7月,阿里巴巴人工智能实验室发布了旗下首款智能音箱“天猫精灵X1”,内置智能语音助手AliGenie,能够听懂中文普通话语音指令,并实现智能家居控制、语音购物、手机充值、音乐播放等功能。

从BAT团队属性来看,百度的搜索靠技术驱动,阿里的电商以运营为主,腾讯的社交注重用户体验;从技术层面来说百度似乎更占优势。这从此前美国《财富》杂志将百度列为全球人工智能四强,在全球化的人工智能能力盘点中,百度是惟一可以和谷歌、微软、亚马逊等公司并列的中国企业可见一斑。

当然,只有技术是不够的,技术必须要落地到场景中、反馈到用户的需求上。

作为电商和云计算巨头,阿里无疑是有这个成为中国版“Echo”野心的。其发布的天猫精灵上,接入了阿里的购物、支付、阿里智能联盟的硬件设备等,在开发平台策略上,也更类似Alexa。AliGenie同样是走开放平台路线,和第三方服务对接。在这个平台上,阿里更强调的,是产品未来所能提供的服务能力。和Alexa放在AWS上一样,AliGenie也运行在阿里云上。基于阿里云和YunOS,为智能硬件提供服务,占领家庭控制中心,是阿里一贯以来的想法。不过也有业内人士认为,从目前落地的场景化应用看,百度的DuerOS似乎更胜一筹。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容