能打字就不说话的我,用起了 vivo NEX 上的 Jovi 助手
“我不明白你在说什么,请再说一遍。”
都说直男不懂女人心,很多智能语音助手,连直男的心都不懂。许久没有和女生说过话的常岩编辑孤单地在家里和某语音助手进行着灵魂和数据的对话。
然而,就跟十分钟前某个女生给常岩编辑回复 “先不说了,我去洗澡啦” 一样,两段对话都无疾而终。不同的是,常岩觉得语音助手实在太蠢了,而那个在上午十点就说去洗澡的女生给他的印象是 “真是爱干净啊”。
智能助手求变
到如今,市面上能买到的智能手机,几乎都可以用上名字各异的智能语音助手了,而自 Siri、Cortana 和 Google Assistant,虽然都不断迭代,但都免不了成为调戏对象,而非 “助手” 的境地。
个中原因并不复杂,许多语音助手并没有优化好,和实际应用结合有限,许多时候人工智能变成了人工智障。许多用户使用手机的习惯,还停留在触屏交互上,并不习惯用语音操控,也就是能打字就绝不说话的我了。
不过事情正在起变化,自去年开始,一个明显的变化是,手机端的人工智能开始不再是个笑话了。学术一点儿说:就是终端侧人工智能。像是 vivo 这样的手机厂商,商汤这样的人工智能服务提供商,高通这样的芯片制造商开始由表及里,打造手机上的智能体验了。
在 vivo NEX 的发布会上,vivo 花了大量的时间来讲述那一颗独立的 AI 按键,以及后面的 Jovi 智能助手,严格来说,Jovi 不仅仅是语音助手,更符合 “智能助手” 的定位。毕竟,实现 “智能” 的方式,不只有语音这条路。在 vivo 之前,三星也在自家的旗舰机上放上了一颗独立的 Bixby 按键,作用类似,可以这么说,Bixby 是当时为数不多相对聪明的语音助手。
理论上,手机端的人工智能应当是全局的。以最常见的 AI 美颜为例,这就是一种软硬件层面结合的例子,也是为什么互联网上的蛇精脸少了,清新可爱的小姐姐多了的原因。
Jovi 体验怎么样?
前面说了这么多的苹果微软三星,以及高通商汤,其实无非就是为了引出后发的 Jovi 语音助手。在 vivo X21 发布的时候,Jovi(意为 enjoy vivo‘s AI)初次亮相,到了 vivo NEX 上,它的地位更高了,原因有二:独立 AI 按键赋予它更便捷的入口,骁龙目前最强移动平台骁龙 845 集成了高通 AIE(人工智能引擎)赋予它更快的 AI 运行速度和更智能的性能。
骁龙 845 是高通的第三代人工智能移动平台,与前代 SoC 相比,骁龙 845 带来了近三倍的人工智能整体性能提升。得益于此,智能手机等移动终端将有更多 AI 应用的发挥空间,诸如语音交互等常见的 AI 功能也会变得更加自然,避免 “鸡同鸭讲” 的尴尬,化身为绝佳的个人助手;同时,也能简化图片与视频的拍摄,让智能识图等功能实现起来更加游刃有余。
说实话,不管是公众场合还是无人场合喊语音助手口令总有些不好意思,这也是 vivo NEX 上那颗独立的 AI 按键存在的意义,就是为了取代略尴尬的 “Hi,Siri” 或者 “Hi,Jovi”。
AI 按键有两种玩法,短按一下是智慧识屏,用过 Google 图片搜索的人,就会知道图片搜索是一项多么好用的服务。比方说,有了这个智慧识屏功能,神农就不需要去尝百草了,打开相机,对准断肠草,按一下 AI 按键,就知道这玩意儿叫断肠草,学名钩吻,属于马钱科,有剧毒,千万别吃。
除了植物,智慧识屏面对动物也不虚,为了体现人类和自然的和谐关系,vivo 还在北京上海打造了一个快闪类型的 NEX 非凡博物馆科普自然生物背后蕴含的科技故事,增强人类对于自然界的认识。
这个博物馆里的主角,就是各种动物和 NEX 手机了,通过 AI 智慧识屏,我们就能知道这些动物是什么,现状如何。
在行车当中通过语音助手给别人打电话发短信之类的已经不再是新鲜的玩法了,随着语音识别和语义理解技术的提升 “给今年已经 28 的小红发个 18 块的红包,并备注生快小红永远十八岁” 才是语音助手的中级玩法,实际上 Jovi 差不多可以支持各种或复杂或简单的微信的语音操作了,不仅仅是发个红包。
但是,我说一句 “睡觉”,手机就自动定好明早闹钟,开启勿扰模式,并打开白噪音软件播放夏雨阵阵,还给女朋友发一个晚安的表情又是什么操作?
如果你看了今年的 WWDC2018,可能还记得 Siri 得到一次进化,增添了 Shortcuts(捷径)的功能,为的也是让 Siri 更好用。
Jovi 的自定义语音口令功能和 Shortcuts 是异曲同工,在以往,我们进行睡觉前的操作可能要好一会儿,说不定操作着操作着就又玩起了手机,现在我们教 Jovi 进行设闹钟、开勿扰、打开白噪音、发表情这样复杂操作,然后 Jovi 就学会这种操作然后根据自定义口令复现。
说起来,Jovi 的语音口令,有点儿像智能音箱们的 “技能”,不仅有官方技能和我的口令,第三方也能贡献出自己的口令出来,其他人也可以复用。
关于 Jovi 的语音体验,其实说起来主要有三点改进:独立 AI 按键唤醒不必开口;长句子复杂句子也能够理解;复杂的骚操作可以教可以学,助手更个性化。
但是,我们对于人工智能在手机上的应用,只是局限于我们主动打开的语音助手吗?真正的智能难道不是它能预知预判吗?
智慧场景是 Jovi 的另一面,它更像是真正的助手,希望帮我们把杂事理顺。在负一屏的 Jovi 智慧场景中,出行天气提醒、会议提醒、行程酒店快递等等。
选择场景后可智能生成信息聚合卡片并适时发送通知,提醒用户观影信息与时间以及适时休息,提示天气预警、通勤路况、预定的酒店信息、快递物流进度、商圈楼层地图以及飞机、火车出行计划;还可以记录活动步数、停车地点,辅助抢红包,传递赛事动态。
比如最近世界杯激战正酣,这里面就会有赛事结果提醒和赛事时间提醒,主屏右滑到负一屏就能直达。基本上,智慧场景的存在感是在需要提醒提示的时候出现,但在 “若无闲事挂心头,便是人间好时节” 的时候,它不会出来刷什么存在感的。
本质上,这个 Jovi 智慧场景就相当于一把瑞士军刀,集合了各种零散的工具,并归类统一管理,使其更听话。
智慧识屏和识图帮助我们探索未知世界;语音助手创建个性化的 “捷径”;智慧场景管理衣食住行;除此之外,Jovi 存在的场景还在游戏模式以及拍照中,前者能够提升游戏体验,稳定网速并屏蔽打扰。
至于智慧拍照分为两种,一是前置美颜,开启智能模式后,手机就能智能分析肤质肤色性别和之前的习惯,自动匹配手机认为最适合的美颜效果。到了后置相机上,人工智能就能根据智能识别场景,根据人像、夜景、花卉、美食等等十几种日常场景设置合适的拍照效果。这个功能可以让摄影小白用户获得更好的照片,免得他们找各种妖艳的滤镜加上去发朋友圈。
智能助手的背后和本质
vivo 此前和高通的关系就一直不错,自今年的 vivo X21 开始,更是针对 AI 的体验进行了又一轮升级。高通推出了骁人工智能引擎 AIE, 在 vivo X21 中得以应用,和 vivo 的人工智能服务结合得更为紧密。 AIE 集成于部分骁龙移动平台上,由多个硬件与软件组成,用来加速终端侧人工智能用户体验。在骁龙 845、骁龙 835、骁龙 820、骁龙 660 移动平台、以及最近发布的骁龙 710 中都能够支持,其中骁龙 845 将支持最顶尖的终端侧人工智能处理。
今年 4 月还一起开了一场发布会来说手机 AI 这回事:
如今 AI 任务正在从云端向终端产品(比如手机)上迁移,因为用户对隐私有要求,还有对 AI 应用低延时和可靠性的考虑。
以往一些机器学习任务往往需要走一趟云端,比如实时 AR 滤镜、语音交互等服务,但现在出于安全、速率的考虑,以及本地移动平台的运算性能的提升,很多人工智能运算在无需经过云端,在终端侧就可以分担和处理了。最起码,这对于优化功耗和提升续航是有帮助的。
下图说明了,手机端的 AI 其实不是一件简单的事情,这个人工智能引擎 AIE 包括了硬件软件和框架在内,硬件的异构计算,软件和框架上和 Google 以及 Android 都有强联系,能更方便 Android 生态的手机生产商和开发者拉进来,发展这里的人工智能应用。
Jovi 的人工智能当然不是孤例的,实际上它是整个人工智能生态的体现,这其中,有高通 AIE,有商汤、Face++ 这样的技术提供商,还有上下游企业的多方合作:高通此前也与商汤科技、创通联达、网易有道等达成合作,共同推动终端侧人工智能发展。最终借 vivo 制造出 NEX 这样的设备,开发出 Jovi 这样的助手。
把眼光从 Jovi 身上挪开下,我们谈一下现在语音助手的本质是什么?当它触及到了这个本质,才有资格谈智能?
我的答案是,如果它可以提高效率,方便用户,提供服务,那么语音助手才有资格称得上是智能语音助手。这和趋势无关,纯粹地是从用户价值来看的。
实际上,在 4G 末尾,5G 即将开端的转折时刻,如何驱动智能手机往前发展,是上游的高通,下游的 vivo ,以及 AI 应用领域的开发者们正在考虑的事情,如何成就外在的真·全面屏,如何让内在服务更智能和效率,几乎成了如今手机发布会的主要元素。
在 5G 黎明之前,Android 智能手机的身份,从跑分机,到游戏机的定位,也终于回到了智能机的原点。相应的,我们也看到,高通骁龙移动平台,从强性能,到高网速低时延,再到了 AIE 等对人工智能支撑,正在不断面向用户与日俱增的多样需求变得丰富起来。