• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

神经网络 P 图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分

商业

2019-02-21 15:23

城里新来了个 AI 修图师,可以说有求必应。

拍了一张美美的照片,但是我还不满意。想瘦脸,想按照我想要的弧线瘦脸;还想让眉毛俏皮上挑、鼻子也挺一点。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

AI 修图师,行不行?

行。

简单。把不满意的地方涂掉,接着想怎么改,就怎么简单勾勒一下线条。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

然后,点一下按钮。效果你看看,行不行?

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

求大神帮忙:帮我 P 成咧嘴微笑,以及眼珠换个颜色。

行。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

世间 P 图的要求不过尔尔,对于这个 AI 修图师来说,简直信手拈来。只要你提好需求,然后一键就能完美实现。

来个实战演示,譬如给美女加个刘海、画个眼影。也是轻轻松松快速完成。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

给小伙去掉墨镜、露出眼睛。没问题,分分钟搞定。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

真的,这都不算难事儿。

加首饰、换发型、补全脸

其实,过去我们也介绍过一些类似的神经网络 P 图大师。

不过这次的 AI 修图师,还有一些新本领。

例如,对于色彩的掌握。

可以根据要求,改变眼球的颜色,轻松告别美瞳或者红眼。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

还能改变发型。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

甚至,给光头 P 上秀发,而且头发可以是不同颜色的混搭,直接生成一种挑染的风范~

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

不仅如此,这个 AI 还能按照需求,定制生成搭配的首饰。

耳坠啊什么的,全都不在话下。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

当然,以上种种还都是小儿科。

这个 AI 能脑补的范围可不只是一点点,而是一大片。

即便你给它这样一张图片。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

只要给出要求。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

AI 修图师也能很好的重建出来。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

左边是脑补的结果,右边是真实的照片,对比一下,你会点赞的……

再展示一组。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

甚至,只给一个带颜色的简笔画,AI 修图师也能生成接近原照片的结果。

你看:

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

这是怎么做到的?

原理解读

其实这个最新出现的 AI 修图大师,来自韩国电子通信研究院(ETRI)。背后是一个名叫 SC-FEGAN 的模型,可以分为生成器、鉴别器两大部分。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

输入一张不完整的图片,加上蒙版、线稿或者颜色信息,生成器就能推断出编辑后的照片。然后,鉴别器来判断这张照片是不是 P 得天衣无缝。

生成器基于英伟达推出的图像修复模型 U-net,一共有 16 个卷积层,所有卷积层都使用 3×3 大小的门控卷积(gated convolution)。

除了输入和输出之外,所有卷积层之后都应用英伟达在 2017 年提出的局部响应归一化(LRN)。

生成器中还引入了各种损失训练,包括每像素损失、感知损失、风格损失、总方差损失以及通用的 GAN 损失函数。

鉴别器,使用的是伊利诺伊大学厄巴纳-香槟分校(UIUC)和 Adobe 研究团队在 2018 年提出 SN-PatchGAN 中的架构。

使用了 3×3 大小的卷积核并应用了梯度惩罚损失项,并没有将 ReLu 函数应用到 GAN 损失之中。

数据集

在这项研究中,训练使用的是香港中文大学汤晓鸥组收集的人脸数据集 CelebA-HQ 数据集。

在其中随机选择两组共 29000 张图像用于训练,1000 张图像用于测试。

将图像统一调整为了 512×512 像素之后,通过自由蒙版和加州大学联合 Adobe 推出的面部图像生成算法 GFC 创建对应的草图和颜色数据。

创建颜色数据时,使用直方图均衡化来避免光反射和阴影造成的颜色污染。

然后,使用加州大学 HED 边沿检测器,来生成与用户输入相对应的草图数据,修改面部图像,然后平滑曲线,并擦除修改图像产生的细小边缘。

效果怎么样?

研究中,与伊利诺伊大学厄巴纳-香槟分校和 Adobe 研究团队的网络 Deepfillv1 进行了对比。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

在对人物面部进行了大面积胡抹乱画之后,Deepfillv1 虽然对整体进行了复原,但是各种涂抹痕迹,以及细节处理,都远远不及新提出的 SC-FEGAN。

此外,与其他的研究相比,SC-FEGAN 对数据的依赖并没有那么高。

哪怕是是输入一幅完全涂抹掉的图像,也能生成一些头发丝出来。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

传送门

这篇论文,来自韩国电子通信研究院,作者是 Youngjoo Jo 和 Jongyoul Park。

神经网络P图新神器:摘墨镜戴美瞳都能搞定,加首饰换发型真假难分 | 代码开源

这项研究的模型代码,已经在 GitHub 上开源了,并且提供了带有图形界面的 Demo,但需要下载安装。

如果你对这项研究感兴趣,请收好传送门:

SC-FEGAN: Face Editing Generative Adversarial Network with User’s Sketch and Color https://arxiv.org/pdf/1902.06838.pdf

GitHub 项目地址:https://github.com/JoYoungjoo/SC-FEGAN

本文来自微信公众号量子位(ID:QbitAI),作者为乾明、安妮,爱范儿经授权发布,文章为作者观点,不代表爱范儿立场。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

追踪人工智能产品和技术新趋势,我们只专注报道 AI。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容