在图像识别上,隐私技术面临人工智能的挑战
在电视或者网络上,我们会看到一些被像素化的文字或者脸部。这是出于隐私考虑,某些信息不适合展示给大众,或者会给当事人带来困扰。不过,随着科技的进步,这种保护隐私的方法已经不那么可靠了。因为,除了人类以外,人工智能也加入到图像识别的行列中。
据 Wired 网站的报道,德州大学和康奈尔科技学院的研究人员发现,通过一些训练,神经网络可以识别图像中隐藏的信息,无论是模糊的门牌号,还是像素化的人脸。而且,他们并不需要费力开发新的方法,只要使用主流的机器学习方法就行了。
“我们使用了非常标准的图像识别技术。这才是让人不安的地方。” 康奈尔科技的研究员 Vitaly Shmatikov 说。由于这些方法广为人知,解析图片隐藏信息只需要一些基础的技术 。
在训练神经网络的过程中,研究人员使用了几个大型的图像库。当神经网络看到的单词、脸部或者物品越多,它的识别准确率就会越高。在神经网络的识别准确率达到 90% 后,研究人员用三种隐私工具处理了图像,并且让神经网络继续解析这些图像。最后,他们开始用新的模糊图像测试神经网络,看它是否能够辨识出面部、物品或者手写的数字。
结果是,在某些数据库和隐私技术上,神经网络的成功率达到 80%,甚至是 90%。在像素化图像方面,随着图片模糊程度增加,神经网络的成功率会降低,但是,它仍然能够达到 50% 到 75% 的成功率。
值得注意的是,神经网络并不能凭空恢复图像,或者把模糊的图片完全还原。它只能将其与自己见过的东西联系起来。比如,在火车站的监控图像里,如果每个过往人员的面部都是模糊的,神经网络不能识别每个人,但是,如果你怀疑某人在特定时间经过,那么,神经网络就能从众人中辨识出那个人。
通过此项研究,研究人员向隐私人士和安全人员提出了警告。在图像识别和数据收集上,机器学习已经成为不可忽视的工具。“我希望,经过了这项研究,当人们发布隐私技术并且宣称其安全之前,首先要经过神经网络的分析,” Shamatikov 说。
图片来自 Wired