Google I/O 全记录,多希望我们能用上这些未来科技
5 月是 Google 总部所在的山景城一年中最为舒适的时节之一,一年一度的 Google I/O 大会如期在这里举行。钢筋与 LED 交织的露天舞台,双肩包和文化衫组合的黑压压人群让人总觉得这里是一场寻常的音乐节,而那些闲坐在草地上的观众们也丝毫不会让你觉得这里发布的一切,将会改变世界,改变亿万人的生活。
Why so serious?Google 可不会现场把程序员叫上来给你码一段看不懂的代码,这里的极客们只会告诉你,嘿,你只需要这么做,后面的东西会让你张大嘴巴。
这是一场会让你感叹机器聪明到让你自愧不如的大会。
Google Lens:聪明的 Google Assistant 多了一双火眼金睛
去年那个解放你双手的人工智能助理 Google Assistant 在今年的 Google I/O 上依然是全场的主角。
Google CEO Sundar Pichai 在介绍了在过去一年 Google 所达成的各种成就后,并没有再多卖关子,端出了一个基于人工智能的新产品,Google Lens。如果你走在路上看到一朵花,但并不知道指什么品种,这时,只需打开 Google Lens,通过摄像头取景,再由 Google Assistant 便可告诉你这朵花的各种信息。
此外,Google Lens 还有一个更酷的功能,它可以识别 OCR,将摄像头对准 Wi-Fi 路由器就可以直接获取用户名和密码,然后直接连接上 Wi-Fi,免去输入各种复杂的 Wi-Fi 密码。
摄像头对准餐厅招牌,马上我们就能看到餐厅的评分信息,堪称超高速版的大众点评。当然,这只是 Google Lens 的一部分功能,在 Google Assistant 的部分会更多的谈及。
Google Assistant:Hey Siri,我来了
首先,我们终于可以通过文字和 Google Assistant 进行交流了。从去年 Google Assistant 上线到现在,用户只能和 Google Assistant 通过语音进行交流(在聊天软件 Allo 上可以通过输入文字交流),不过,Google 发现,人们最常用的输入与交流方式依然是通过文字,因此,Google 为 Google Assistant 引入了文字输入。
此外,Google Assistant 最大的变化,是它集成了 Google Lens,也就是说,Google Assistant 拥有了通过摄像头直接识别图像的能力,当你去到国外遇到看不懂的文字时,只需要让 Google Assistant “看到” 文字便可以翻译成你的母语。即便我们外语能力不怎么好,有了这两个神器,出国在外也就不那么慌了,Google 在弥平语言鸿沟上又更进了一步。
除了直接翻译文字,Google Assistant 还可以识别出餐厅的名称,在现场的演示中,Google Assistant 可以将识别出的餐厅信息呈现给用户,包括菜单等等,过去需要在不同应用中实现的操作,现在只需要一个 Google Assistant 就能够实现了。
过去一年,Google 在不遗余力地推广 Google Assistant,除了在 Android 平台上人工智能助手的统治地位,Google Assistant 也将入驻 iPhone,到时候它如何同 iPhone 上的主人 Siri 相处,或许也是个有趣的话题。不仅如此,Google 还计划将 Google Assistant 放进更多的生活用品中,Google 目前已经为 Google Assistant 找到了 70 多个 “婆家”,你能想到的都有可能,洗衣机、婴儿车、购物车等等等等。
遗憾的是,Google Assistant 的 iOS 版目前未在中区 App Store 上架,如果你想第一时间体验 Google Assistant,在 AppSo(微信公众号:AppSo)/爱范儿(微信号公众号: ifanr)后台回复「美区」获取美区账号注册教程,然后就可以在 iPhone 上尝鲜 Google Assistant。
Cloud TPU:强劲的云端大脑,AI First 战略的第一步
在过去几年,Google 在机器学习方面取得了不少的进步。这些成果大大提高了 Google 翻译的质量,也在 Google 搜索结果中发挥了关键作用,与此同时使用 Google Photos 查找您想要的照片将更为方便。强大的学习功能也为 AlphaGo 人工智能系统提供了预测和作决策的基础功能,这使得 DeepMind 的 AlphaGo 能够打败世界顶级棋手之一李世石。
不过,Google 第一代的 TPU 在针对不同用途时,仍然需要分开单独培训,这样的培训需要花费很多的时间成本。
于是,Google 设计了一个全新的机器学习系统,以消除瓶颈并最大限度地提高整体性能。这个系统的核心就是 Google 今天推出的第二代 Tensor 处理单元(TPU),它可以训练和运行机器学习模型,Google 将其称之为 Cloud TPU。
现在,Google 表示,Cloud TPU 已经全面投入使用,并且正部署在 Google Compute Engine 这个平台上,它将 64 个 Cloud TPU 组合成 TPU Pods,有效地将 Google 服务器变为具有 11.5 petaflops 计算能力的超级计算机,每个 Cloud TPU 可提供高达 180 teraflops 的浮点性能来培训和运行机器学习模型。
使用这些 TPU Pods,可以有效的减少机器学的培训时间,以往一个大型的翻译模组,需要花费 32 个最好的商用 GPU 用上一整天的时间完成,但现在,只需要八分之一的 TPU Pod 就能达到同样的效果和精准度。
而这对于培训系统更普遍的意义是,通过大量的计算来改进 AI 软件。所以当硬件性能越强大的时候,你得到的结果就越快。这不仅能缩短时间,还能提高每个机器学习者更快速地进行迭代和进行更多实验的能力。
为了帮助尽可能多的研究人员,进一步加快开放机器学习研究的步伐,Google 也将通过 TensorFlow 研究云免费为机器学习研究人员提供 1000 个 Cloud TPU 。
它成为 Google 在探索 AI 领域拓荒路上强有力的功臣。
Google CEO 劈柴叔(Pichai)还提到了前不久推出的 AutoDraw,能帮你自动画画,这个应用正是基于 Google 人工智能服务。如想了解这个有趣的应用,请在 AppSo(微信公众号:AppSo)/爱范儿(微信公众号: ifanr)后台回复「AutoDraw」获取详细评测。
继续解放你双手的 Google Home
Google Home 是另一个基于 Google Assistant 的产品,诞生之初就是想在解放你双手的同时让你动动嘴也能做更多事。虽然 Google 这次并没有拿出在硬件上有所改进的 Google Home,但 “Hands Free” 的宗旨被执行得更加彻底了。
Google Home 这次获得了一个最重要的功能-“Hands Free Calling”,用户可以直接通过 Google Home 拨打电话,而它并不像其它音箱一样与手机连接后成为手机的扬声器,而是真正可以脱离手机直接拨打电话。
这项功能当前只能在美国和加拿大使用,不过是完全免费的。默认情况下,被呼叫人的手机上会显示一个私人号码,但用户可以将自己的手机号码与 Google Home 配对,避免对方因为未知号码不敢接听。
此外,如果有家人供用同一个 Google Home,Google Home 也支持绑定多个号码,而在不同的用户使用时,Google Home 会自动识别是谁在使用电话功能,并同步这个人的通讯录,简直智能得不行。
除了拨打电话功能,Google Home 也终于支持各种状态如航班信息、日程等提醒功能,这使它更加像一个家庭管家。
对了,Google Home 终于支持蓝牙链接,可以连上手机播放你网易云音乐上的歌曲了,此外,它还增加了几个新的内容合作方,包括 HBO Now 和 Spotify 免费版,以及 YouTube 今年推出的流媒体服务 YouTube TV。总之,Google Home 更智能,也更传统了。
Google Photos:带来更多实用功能
在不到两年的时间里,凭借着免费、高容量的存储空间、优秀的使用体验以及类似 iPhone 照片的回忆功能,Google Photos 月活跃用户达到了 5 亿,这些用户每天上传 12 亿照片和视频。
今天在 Google I/O 大会上,这项服务也带来了更多新的功能。首先是 Suggested Sharing ,它能够通过机器学习,智能识别照片中的人,让你一键发送含有某人的照片给对方。当然,这样聪明过头的智能,不知道会不会不小心捅出什么娄子。
虽然 Google Photos 不知道你的朋友是谁,但它做了一系列聪明的预测。如果你将某个人的照片发送给同一个电话号码或电子邮件数次,下一次拍这个人照片的时候,Google Photos 将会建议你使用该电话号码或电子邮件地址来分享。
如果你的朋友也是 Google Photos 的用户,他们可以一键将照片保存到自己的云库中。这样的功能在一些聚会和派对上就很实用,不用过多地担心照片分享错了。
其次是 Shared Libraries,上面提到的功能,能让你一键分享。而这个功能,你能设置自动分享某些照片给某人。例如,你能设置分享自己孩子的照片给伴侣。
你可以选择共享你的整个相册,也可以选择只分享某些人一部分照片。一旦邀请被选中的人,他们将看到你授权他们查看的任何照片,并且实时更新。
最后是 Google Lens x Google Photos,我们总会通过拍照来记住某些要做的事:todo list、要读的书、要买的东西…而当 Google Lens 融入 Google Photos 之后,能帮助你更好地完成任务。
你可以在 Google Photos 能激活 Google Lens,然后它能识别照片里面的建筑物,识别油画作品信息。甚至拍下的名片,它也能自动识别并且保存成联系人,该功能将于今年晚些时候推出。
有意思的是,这些功能将预装在搭载最新版原生 Android 的智能手机上。
此外,Google Photos 还将提供相册集 “Photo Books” 的制作服务,Google 希望让相册集成为人们每年多次购买的物品。它的起价是 9.9 美元包含了前 20 页的制作费用,可为用户提供 7 英寸或 20 英寸两种尺寸的相册本供选择。超过 20 页后,每页是 0.35 美元到 0.65 美元。
那么,这个相册算不算 Google 硬件计划的一部分呢?
Android:一个更加完美的配角
在介绍 Android O 时,Andorid 研发副总裁 Dave Burke 的语速比去年要快不少,发布会上留给 Android 的时间也并不多,曾经 Google I/O 的绝对主角已经易主。
同去年一样,Google 在今年 3 月份便放出了 Android O 系统的首个开发者预览版,不过从 Android 5.0 时代开始,之后每一代 Android 系统的变化并不太大,所做的改变也多为各种优化,新功能和界面的变化并不多。
这次的 Android O 也一样,你很难张口就说出它与上一代系统 Android N 的区别。但,它确实更加面面俱到了。
在 Android N 时代,Android 就已经实现了多窗口模式,但在这个模式下,两个同时开启的应用只能被分割成上下两个界面,但在手机屏幕上,显示效果并不理想,而且使用场景也并不多,一边发微信一边看 YouTube 的情况只有在为了体验这项功能时才发生。
在 Android O 上,画中画功能的加入似乎比多窗口模式更加的实用,在支持画中画功能的应用全屏运行时,比如正在播放视频的 YouTube,此时只需要按一下 Home 键,应用界面会消失,但正在播放的视频画面会以小窗口的形式悬浮在手机上,用户可以随意拖动窗口的位置,也可以进行播放或停止的指令,但这都不会影响其它应用的使用,想要关闭小窗口只需要向下划出屏幕即可。
不管是从小窗口所占用的面积还是显示的内容上,画中画似乎比多窗口模式更加的实用。YouTube 和 Google 自家的视频聊天软件 Duo 可以在 Android O 上实现画中画功能。
此外,Android O 增添了一个你可能从很多手机上都见过的功能—Notification Dots,但它更像 iOS 的 3D Touch。
以 Instagram 为例,之前在 Android 上都是需要通过下拉菜单来读取通知,但现在,除了通知数量会显示在 App 右上角,长按 App 图标就可以查看新消息通知了,Shortcuts 虽然更像 3D Touch,但确实比以前更实用了。
在 Dave Burke 介绍 Android O 飞快的语速中,还有两个微小的功能不能被忽视,其中一个,叫做 Autofill,也就是自动填充功能,这个功能在电脑上和浏览器上很常见,但手机应用中并不多见。在 Android O 中,以 Twitter 为例,打开应用后,只需按一下用户名和密码的输入区域,就可以自动填充曾保存过的用户名和密码,再点一下,就可以登录了。这项功能的实现,也需要应用中有相应的 API。
另一个功能叫做 Smart Text Selection,这又是一项基于人工智能的功能。举个例子,在邮件里面,如果你在密密麻麻文字中选中了地址,系统便会自动弹出 Google Maps 的选项,你可以进入 Google Maps 查看更多信息;如果选中了电话号吗,则会出现拨打选项;选中邮件地址,则出现邮箱的相关选项。
除了上面提到的这些功能,Android O 还能帮你防广告防流氓 app,更多详细介绍,在 AppSo(微信公众号:AppSo)/爱范儿(微信公众号: ifanr)后台回复「防流氓」获取我们之前的评测文章。
另外,经典输入应用 GBoard 现在已经支持 191 种语言。现在 GBoard 融入了翻译功能,你能直接输入一种语言,然后让它自动翻译为另一种语言,直接在对话框中发出去。这意味着,如果你与外国人聊天,再也不用跳转其它 app 查来查去了。
当然,Android O 依然在强调安全性,更快的系统和应用启动速度,这些改进虽然微小,但对于一个已经较为成熟的系统来说,稳定比激进的改变更加重要。
AI 优先的今天,Android 只是一个载体
可以看到,人工智能在今年的 Google I/O 上更加的无处不在。Google 也宣布,将把 AI 从云端直接植入在设备中,同时也发布了其机器学习框架的移动设备版本,TensorFlow Lite。但为什么要把 AI 直接植入你的手机中呢?
因为在手机上,机器学习应用可以更快的运行,且相较于存在于云端的数据更加的安全,更重要的是,它可以脱离网络离线工作,当前的 AI 都不能脱离网络独立工作。这也将使得用户有更好的使用体验,Google 也可以从中获得更直接的用户使用习惯。而 Google 认为,你手中的下一个手机,将会拥有一个住着 AI 的芯片。
虽然 Android 已不是 Google I/O 的主角,但它对 Google 来说,依然是这个还未饱和的移动市场的主角。可能很少有人知道 Android One 这个项目,这个项目是 Google 专门面向经济薄弱,基础设施较为落后的地区推出的,主要是售卖价格较为低廉的原生 Android 手机,但与同价位的其它手机厂商相比,Android One 手机的低价低配难有说服力,因此 Android One 在很多地方并不被用户买账。
Google 这次宣布了 Android One 的继任者 Android Go,Android Go 能够在 512MB 内存的手机上较流畅运行,主打的自然是亚非拉地区的市场,显然 Google 不愿放弃其硬件业务在新兴市场的扩张,“Building for Billions” 的愿望仍在继续。
Daydream VR:美美的白日梦继续做下去
和此前预测的不太一样,AR 和 VR 在本次 Google I/O 大会上并没有占据过多篇幅。
Google VR 副总裁 Clay Bavor 上台回顾去年在 VR/AR 方面取得的进展,在回顾自家的 Daydream VR 平台之后, 表示今年 LG G6、以及三星 Galaxy S8 也将支持 Google Daydream 平台,用户通过一个简单的软件更新即可获得支持。
除此之外,Daydream 平台也迎来了全新的 VR 设备——独立的头戴式设备 Daydream VR 一体机 ,Google 将其定位于中端 VR 产品,它既不是入门级的纸盒+手机,也不是像 HTC Vive 那种需要高配置电脑需求的旗舰产品。
Daydream VR 一体机是 Google 与高通、联想以及 HTC 合作的产品。其拥有独立运行的硬件,不需要连接手机或电脑就可以独立运行,有点类似大疆的 Goggles。然而会上并没有公布这款产品的发布日期和价格,我们只粗略地看到这款产品的轮廓。
在 AR 方面,一段 Google VR 教育应用 “Google Expeditions” 的介绍视频中,已加入一个增强现实(AR)模式,教室中出现了虚拟版本的火山和龙卷风,该功能将于今年晚些时候正式推出。
另外,Google 还介绍了视觉定位服务(Visual Positioning Service),比如在进入某个商店之后,你可以得到各种物品摆放位置的提示,手机可以获得货架的空间数据,然后导引你更快地走向它。
我们离人工智能时代这么近,那么远
在 Google I/O 2017 大会的现场,聚集了爱范儿在内的不少中国科技媒体记者们,以及互联网从业者,而在时差数个小时的北京中关村,上海张江,深圳南山等地,可能需要用百万来计算的科技爱好者强忍睡意盯着大大小小的屏幕观看大会直播。
这是真正的 “天涯共此时”,我们对变革与创新的步伐如此关注,生怕落后一点。
我们再一次领教了 Google 如何把晦涩难懂的人工智能技术,包装成了聪明智能的 Google Lens,Google Assistant 等服务,让我们知道,这是人工智能,而不是 “人工智障”。上一次 Google 科普人工智能的震撼仍未消散:AlphaGo 在人机围棋比赛中大胜韩国高手李世石。
而另一方面,当人工智能成为风口之后,又有多少大大小小的公司改头换面投入其中,他们之中,有曾经是做可穿戴设备的,有去年折戟 VR 的。
信息大爆炸时代,Google 的远去已经让我们很受伤,百度面前无对手之后的血泪教训,Google Play 缺失带来的国内 Android 乱象等等。人工智能时代,Google 在这次 I/O 2017 大会上证明了自己将前沿技术落地的能力,看起来,我们又不是那么容易用到。
事实上,每次 Google I/O 大会总能让我们振奋,感叹科技改变世界,改变生活;同时也让我们略感沮丧,徒有临渊羡鱼的遗憾。
(本文由刘罕,林树洽和刘学文共同完成)