这张照片是哪里拍摄的?神经网络可以告诉你
在侦探剧中,我们常常会看到这样的场景:从某个视频截图或者图片中,精明的侦探可以捕捉到各种细节,然后快速判断出图片的拍摄地点。现在,计算机也能做到了,而且,它比人类做的更好。
根据 MIT Technology Review 的报道,Google 的计算机视觉专家 Tobias Weyand 与同事对深度学习机器进行了训练,使其可以识别出任何图片的位置。在这方面,机器的识别能力明显超过了人类,而且,它甚至能够对室内拍摄的图片、缺乏线索的图片(食物、宠物)进行位置确认。
他们的方法是这样的。首先,根据不同区域的图片数量,他们把全球分为 2.6 万个不同尺寸的方格。由于大城市的图片多,分配的方格就比较多,而偏远的地区则较少。海洋、极地等都被忽略了,因为图片太少了。
然后,他们收集网络上有地理标记的图片,建了个数据库,确定每张图片归属于那个方格。这个数据库很庞大,包括 1.26 亿张图片以及位置数据。他们使用了 9100 万张图片,对神经网络进行训练,然后使用剩余的 3400 万张图片进行测试。最后,他们开始用不同方法测试这个图片识别网络——称作 PlaNet——看看它的效果如何。
在测试中,他们让 PlaNet 与 10 位经常旅行的人进行了一场比赛。结果,PlaNet 的表现超过了人类。在识别位置时,人类可以观察植物、建筑风格等线索,而机器只能依赖像素,那么,它是如何超过人类的呢。“我们认为,PlaNet 的优势在于,它访问的地点远远超过了人类,因此,它能够识别一些微妙的细节,即使经常旅行的人也难以做到这一点。” Weyand 说。
图片来自 extremetech