在这个地方里搜索表情,会有奇迹发生 | MindStore
有时候看着一张照片,盯久了,脑袋会突然卡壳,辨认不出照片里面是什么东西,每当遇到这种情况的时候,我想我内心是崩溃的。
可这样的烦恼,我想也许以后就不存在了,MindStore 分享了一个由微软推出的智能图像识别机器人 CaptionBot,可以像人类一样识别并且能够描述图片的内容。除了能够告诉我图片中的物体是什么,还能让我知道它正在做什么。
CaptionBot 的出现主要是微软为了展示其通过多年的研究成果,特意推出的微软认知服务(Microsoft Cognitive Services)。确切地说,CaptionBot 由计算机视觉 API、人工情感 API 和必应图像搜索 API 等三个部分组成。
不可思议的辨认识别度
我们可以发现 CaptionBot 网站本身有提供六张图片作为测试,只是想尝尝鲜的人只要轻点其中一张图片,不久就会出现分析结果。
CaptionBot 识别的准确度比想象中要高很多,不仅仅能识别出图片中的物体是三明治,还知道它是被切成两块的三明治。在三明治的下面,我们还可以为识别的结果打分,根据评分来判断识别结果的正确性。
也许随着评分人数的增加,CaptionBot 的深度学习系统使其智能识别准确度越来越高。
当然,像我这种具备强烈好奇心的人,自然不会忽略页面下面的 “Upload a photo” 的字眼。CaptionBot 提供由本地上传和图片链接等两种图片上传的方式,操作方式跟平时使用的一样,按提示一步步完成即可。
有时候 CaptionBot 充满人性化的语气真是让人忍俊不禁。
实际上 CaptionBot 的出现,让我想起微软在 2015 年开发者大会上,用来展示自家人脸识别 API 的网站 How-Old.net,用户只要上传照片,系统就会自动判断你的性别和年龄。
当时这个产品在国内外的社交平台上都火了一圈,不知道大家还记不记得,当时的朋友圈几乎每张照片上,每个人的脸都被方框框住,每个方框上面都飘着一个数字,说不定 CaptionBot 就是下一个转疯朋友圈的 How-Old.net.
当时每个人都以年龄数字小为荣,可有一个诡异的事件不知道大家有没有发现。大家可以观察一下上面这张图片,然后在评论区给我留言发现了什么。
他们的 “第三只眼睛”
CaptionBot,是微软在其图像识别等领域取得的成果的展现, 目前它可能仅仅只是作为一个小测试,识别某张图片的内容。
我在刚打开这个网站的时候,心里也是嘀咕着说:“这玩意儿有什么用啊?不就是识别图片嘛。”
没错,对于普通人来说,CaptionBot 可能仅仅是在社交媒体上充当一个玩具的作用,我利用这样一个玩具达到我娱乐和社交的目的,这样就完了,也没有后面的东西了,也许仅仅是两三天后我就已经忘记这样一个网站的存在了。
可是仔细想一想,对于盲人等一些有缺陷的人来说,这可能就是打开新世界的大门了。假如一个盲人戴着装有能实现 CaptionBot 功能的 Google Glass 出门,任何图像内容能够被智能识别并且转化为语音,那盲人是否也能通过这样的 “第三只眼” 来 “看到” 这个世界了?
期待这一天的到来。
题图来自:unsplash