2018年的各大手机厂商发布会中,语音助手的亮相已经成为必不可少的环节。各大手机厂商陆续推出系统语音助手,并将AI语音作为一大卖点。
三星的Bixby、小米的小爱同学、联想的乐语音、vivo NEX的Jovi、OPPO Find X的小欧语音助手、苹果新推出的Siri 功能……这些语音助手的名字相信大家并不陌生。
据IDG报告显示,2017年全球出货的14.62亿台智能手机中,至少有10亿台手机搭载了语音助手。三星、华为先后入场,小米、vivo紧随其后,再加上众多小众品牌例如魅族、360、夏普等紧跟AI语音的步伐,这个市场已经到了无人能忽视的地步,语音助手已经落地各大手机品牌型号,成为智能手机的标配。
趋势一:打破传统对话框模式,创建APP生态
Siri是对话框式页面集成方式的代表,基本上所有的语音问答都锁定在Siri的对话框中完成,它能做的大多是为用户提供信息,而很难帮用户实际操作手机APP,即使可以操作一部分,能实现的功能也非常有限。
当你对Siri说:“用微信给明明发100元红包”时,它执行的却是在微信给明明发送“100元红包”这几个大字。而发微信红包这种小事,市面上很多语音助手都能轻松做到了。
Siri之所以还做不到,很大程度上是因为这种传统的人机对话界面扩展功能开发成本高、接入第三方应用API需要冗长的业务谈判。如果微信没开API接口,Siri就很难实现发微信红包这类功能。而今年发布的几大语音助手都能做到,是因为巧妙避开了API接口和复杂的商业谈判,用模拟手指点击的方式,实现各个APP之间的深度操作。
在UI设计上,各大手机厂商的语音助手多已摒弃了以Siri为代表的对话框,而采用悬浮框设计,增加了交互灵活性,实现了与常用APP的打通联动。同时,这样有助于通过语音助手将用户往APP上进行引导,与各类APP共生共赢,创建良好生态。
趋势二:摆脱“鸡肋”,听懂+做到才是真AI
各大手机厂商语音助手之间的比拼,说到底,是一场关于能做多少事情的比拼。而能帮用户做多少事,取决于语音助手可以能听懂用户多少种表达方法、覆盖多少APP、支持多少语音技能。
调戏功能曾经被作为语音助手吸引用户眼球的亮点,而如今,只懂调戏却不实用的语音助手都会被吐槽“鸡肋”。能真正帮用户解放双手,操作应用内深层功能,才是语音助手的大势所趋。
在小米8发布会上,展示出小爱同学于30余款APP合作,共同打造语音服务生态,包括常用的视频、导航、音乐、出行、购物等APP。
在早期Bixby发布会上,曾介绍Bixby中文版支持超过30款原生应用,可支持7000余种功能。合作的第三方主流应用包括爱奇艺、百度地图、酷狗音乐、摩拜单车、ofo、支付宝、新浪微博、腾讯新闻等,覆盖应用数量在持续增加。
VIVO NEX发布会上表示,系统语音助手Jovi已经支持20个高频场景以及600项左右的核心功能,覆盖了包括大家熟悉的百度地图、京东、淘宝、微信、大众点评、音乐、滴滴出行等。
在“听懂”和“做到”两方面,手机厂商都面临着来自用户的严峻考验。
比如,语音助手可以听懂并执行“我要打车到火车站”,但换了另一种说法“帮我打个车去火车站”,却听不懂了。之所以听不懂,是因为自然语言理解技术面临挑战,无法充分理解用户的表达意图从而导致无法顺利操作。
或是“在饿了么上订一份麻辣香锅”可以执行,但“在饿了么上订一份过桥米线”却做不到了。之所以做不到,是因为语音技能拓展成本相对较高,每添加一条指令都需要工程师手写编码完成。这也导致了语音技能数量增长速度缓慢,用户体验受到限制。
奇点机智作为一家语音交互技术公司,就在解决自然语言理解、语音技能拓展的难题,能够真正听懂用户,让手机厂商、各大APP、智能硬件以快速、灵活、低成本的方式创建语音技能。
创建的NI开放平台,无需编码零技术门槛,5分钟即可为产品在技能工场添加语音技能,不仅仅面向开发者,产品、运营人员均可轻松上手。另外,所有技能均可自定义,并且可多人协作共同开发,技能发布即可用。这样以来,语音技能的造价可变低,增速大大提高,当语音技能越来越丰富之后,用户也会发现语音助手不再是“鸡肋”。
趋势三:个性定制语音技能,快捷功能一句直达
在2018年6月的苹果全球开发者大会上,推出了Siri 快捷键功能,用户可以自定义技能,为某个场景设定多项执行操作。这一功能让Siri跳出了传统的对话框集成页面,调动了更多APP功能,让Siri重新“活”了起来。
大会上展示了“回家”的快捷功能。当说出“回家”这一指令,Siri则会按照事先的设置打开地图导航回家、设置好家里的温度、并给舍友发信息告诉她自己预计到家的时间。
将一系列连贯动作指令浓缩成一句话,成为了各大语音助手的热门功能。与此类似的,还有Bixby的快捷指令、Jovi的自定义增添指令等。比如,你在Bixby上设置“早上好”这一快捷指令后,可以自定义打开任意多个 App 先后执行命令,包括关闭手机免打扰、关闭手机夜间模式、播放音乐等。
打造更贴心、更个性、更快捷方便的私人助手,会成为语音助手的为来的发展方向。
趋势四:打造“学习型AI”,每人都是技能创造者
当今时代,不会学习的语音助手不是好AI。
“学习型AI”的概念出现在多个语音助手上,比如Bixby可以学习用户的使用习惯,越来越懂用户的喜好。Vivo NEX的用户可以教Jovi新的技能,进行命令教学。
用户自发创造的语音技能,可以通过共享给其他用户,为语音助手赋予更大的能量。Bixby鼓励用户通过社区进行分享,Jovi也打造了“Jovi广场”,让用户共享创意技能,如果自己不想手把手教学,也可以到广场中学习其他人的教学命令。
其实,学习型AI的概念虽然今年才兴起,但早在2017年4月乐视 AI 版手机发布时,就已存在了。当遇到乐视语音助手“乐乐”还不会的功能时,用户便可以点击学习按钮教它新的技能。
大多手机系统语音助手背后的技术支持都是由行业领先的语音技术公司来实现。“乐乐”背后的技术支持便是奇点机智。学习功能这一概念起初由提出,在乐视手机上初次与用户见面。
也为联想、国美等手机品牌打造了系统内语音助手。拥有行业领先的语音识别、中文语义理解、机器学习等人工智能前沿技术,可以为手机厂商打造全能语音助手,降低厂商自主研发成本、缩短开发流程。
除此之外,打造了一款第三方语音助手APP——“布点语音”,于2018年7月15日陆续上线各大安卓应用商店。
“布点语音”拥有超强学习功能,被称为“真正会学习的语音助手” 。例如,对它说 “我教你B站看王者荣耀直播” ,随后在手机上演示一遍完整的操作路径,它就能记住这个操作了。当下次再说出这一指令,它就可以像一只“无形的手”一样,直接跳转到这一直播频道。
此外,“布点语音”支持技能共享、个性技能自定义,已经可以覆盖300余款APP并支持12000多个语音技能,是目前覆盖应用以及技能数量最多的语音助手APP。欢迎感兴趣的朋友前往安卓应用商店下载体验。