• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

重建模糊,低分辨率人脸图像的正经 AI,被人用表情包玩坏了

公司

2019-09-06 09:10

《恐袭波士顿》这部根据真实情况改编的电影有这样一个情节,警察在波士顿爆炸案发生后开始浏览各种各样的监控录像,意图找出那个行为异于常人的嫌疑人。

在监控录像中,爆炸发生时有一个人把头转向了相反的方向,警方因此锁定了犯罪嫌疑人。

▲ 电影里的技术总是很高端. 图片来自:《碟中谍 4》

在电影中,警察或许只需要对控制监控的操作员说「放大,再放大!」屏幕就能清晰地呈现嫌疑人的大脸,旁边还配上他的生平年月、家庭情况、现居住址……

现实情况就很一言难尽了,谁知道录下嫌疑人的监控摄像头是几年前装的呢?这时候如果你只会说「放大,再放大!」那你估计就只能看到一个色彩均匀的像素块了。想只凭借监控就锁定犯罪嫌疑人,就目前的硬件条件而言还太难了。

▲ 图片来自:《恐袭波士顿》

硬件跟不上,那软件呢?最近,研究人员就展示了 AI 可能为此作出怎样的贡献,它或许可以帮助我们在不失真的情况下恢复人脸的基本特征。

研究人员通过 AI 可以重建模糊、低分辨率的人脸图像,使之更清晰、分辨率更高,更接近于真实的人脸。这一进展来自于人工智能研究的一个领域,被称为「人脸超分辨率」,该领域专注于从失真或低分辨率图像中重建更贴近真实的人脸。

最近在一个机器学习会议上,韩国高级科学技术研究院的研究人员发表了《通过对面部标记的关注,逐步提高人脸的超分辨率》的论文。研究人员在论文中提出了一种新的人脸识别方法,该方法可以生成 8 倍超分辨率的人脸图像,并完全保留面部细节。

▲ 像素图像,还原图像和真实图像的对比

为了锻炼 AI,研究人员采用了一种渐进的训练方法。通过将网络分成连续的步骤进行稳定的训练,每个步骤的输出的分辨率都在逐渐提高。他们还提出了一种新的面部注意力丢失方法,通过增加像素差和热图值来更好地恢复面部属性。除此之外,训练 AI 还用了最先进的人脸对齐网络提取出适用于人脸 SR 的热图,以此减少训练时间。

实验结果证明,研究人员的方法在定性、定量测量、感知质量等方面都优于目前最先进的方法。利用人工智能的能力,我们从像素化的初始图像中识别一个人会变得容易得多。

当然,这毕竟是 AI,还是有很多令人觉得啼笑皆非的成果。

Twitter 用户 @ jonathanfly 就把我们平常用的表情包模糊成像素块去让 AI 完成挑战,表情包模糊后的大小正好为 16×16 像素。结果 AI 还原出来的结果有点「可怕」,本身像素化可爱风的鼻子眼睛都变成了真实向的人脸,看上去有点搞笑,变成了我们常用的魔性表情包。

但用真人照片像素化之后,正常的图片还算贴近原貌。

如果调整了像素块图片的对比度,对齐人脸效果稍稍偏离就可能造成还原人脸的鼻飞眼斜。

如果你把披萨像素化之后再识别,那么香肠也会变成性感红唇。

不管是多奇怪的图像最后都能长出人类的五官。

毕竟 AI 还是靠着我们教给它的东西在做图像重建,所以还原出这些偏向人脸的效果其实也不让人意外,目前还没那么完善也可以理解。

博客 I Forced A Bot 还尝试了将像素化图片从 16×16 调整到 128×128,然后再降低到 16×16。通过这样的处理,他通常得到的都是一个更贴近真实人脸的结果。因为图像更模糊能为 AI 的还原工作提供了更多创造性解释图像的空间。

I Forced A Bot 还发现了一个论文中没有公布的细节,有些生成的人脸图像脸上会有黑色的不明物,博客作者将其成为「哈利波特的伤疤」。

到这,这个 AI 已经被人拿来做了各种各样表情包的尝试,看上去已经被彻底「玩坏了」。

但我们还是要承认,只要你不要把 AI 用在表情包还原上,那么专注于模糊图像还原的 AI 还是有非常积极的作用。如果在某个案件中捕捉到的嫌疑人图像过于模糊,那么 AI 很可能会成为呈现犯罪嫌疑人相貌的最后一环。

不过现有的技术还无法用于刑侦勘察,我们还是只能等它学成归来,再报效人类。

题图来自 Pixel Art Maker。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中