Google 收购的这家公司,可以让你的手机摄像头学会快速思考
Google 于美国西部时间本周三宣布收购初创公司 Moodstocks,一家专注于图像识别的法国初创公司,以进一步发展 Google 自身的机器学习能力。双方都未透露其收购的具体金额。
Moodstocks 官方宣布,其公司原本基于 app 的图像识别服务将会暂停,并将不再开放 SDK。这家公司的技术将直接并入 Google,以大范围提升 Google 目前基于图像的人工智能能力。
(图片来自:TechPP)
Moodstocks 可以识别用户拍摄的或网页上的图像,并为用户提供注解,可以被看做是一个以图片为基础的搜索引擎。他们说:
我们希望将手机摄像头变成可以识别周围环境的智能传感器,给机器以双眼。
而事实上 Google 已经做出过类似的 app。Google Goggles 提供即时拍摄、即时识别的功能,但这款应用是将图片直接上传到服务器并进行比对,效率较低。
相比之下,Moodstocks 的识别工作大部分都直接在手机上进行,通过一套算法将转化的图像信息与服务器数据进行匹配。因此,与传统图像识别技术相比,Moodstocks 的识别速度会大大加快,同时也减少了运行复杂程度。
(图片来自:Engadget)
Google 在图像识别上一直有较大投入。
Google 相册的智能照片检索可以让你通过直接搜索关键词如 “沙滩”、“家庭” 找到对应照片。Vincent Simonet,Google R&D 中心的法国负责人说:
我们在智能图像识别上还有很长的路要走,Moodstocks 在这时介入会极大地帮助我们。
(图片来自:Google Play)
Google 没有进一步具体透露这项设备会如何与现有业务结合。TechCrunch 认为,与其他服务协同的可能性非常多。
除去 Google 相册,最直接的效用是提高 Google 图片搜索的精度,并有效提高 Now on Tap 的识别能力。
如 Google 在 I/O 上公布的社交软件 Allo,它可以识别用户聊天界面中发送的图片,并直接给出自动回复。Moodstocks 的技术可以让这一过程更加高效。
此外,Google 甚至可能在 Android 系统或搜索引擎中直接内建拍照即搜,拍摄你想查询的物品,不管他是一张海报还是一个雕塑,可以直接弹出对应信息。
这可以为增强现实的发展铺就道路。
比如,今年的 Google I/O 大会上就展示了依靠图像信息的翻译应用。通过摄像头扫描街边招牌上的英文菜单,可以直接在屏幕的实时预览画面上显示中文翻译。
在展示时,翻译的显示还依旧有明显的延迟。而采用 Moodstocks 的技术则可有望解决这一问题,让这一技术对用户来说达到真正可用的水平。
同时,也可由此推测,该系统在未来有望应用到 Project Tango 设备上用于在环境中实时查询信息。
(图片来自:Engadget)
图像识别是人工智能的眼睛,增强这一环节已经成为业界共识。
Google 在收购 Moodstocks 之前还把 JetPac 和 PittPatt 收入麾下,用于提高人脸识别功能。这项技术也被成功应用在 Google 相册中。
两周前,Twitter 收购了 Magic Pony。这家公司采用一种模仿神经网络原理的技术,智能提升图片所含信息, 甚至将其用于虚拟现实。
类似的,今年早些时候,亚马逊收购了 Orbeus,这同样是一家专注图像识别的公司。于 Google 相册相仿,苹果之前发布的 iOS 10 也加入图像的智能识别与检索。
Demis Hassabis,Google 旗下 DeepMind 的联合创始人点出了目前人工智能发展的两大方向:
现在的人工智能研究正变得越来越令人激动,我们在对人类自然语音的识别以及图像的识别这两大技术上取得了许多突破。
Google Now, Siri 以及亚马逊的 Alexa 代表着前者,即对机器听觉的完善,而这些大大小小的在图像学习领域的收购则代表着后者,即对视觉分析能力的提高。
Moodstocks 的技术让我们看到了手机摄像头可以实时检索环境信息的那一天。
题图来自:Sapce and Time