赞
踩
提高低分辨率面部图像的质量,并在此类分辨率较差的图像上准确定位面部标志
。为此,我们做出了以下五点贡献:(a)我们提出了superFAN- :这是第一个同时解决这两项任务的端到端系统,即既提高了面部分辨率又检测了面部标志。新型Super-FAN在于通过集成子网通过热图回归实现人脸对齐并优化新型热图损失,从而将结构信息整合到基于GAN的超分辨率算法中。 (b)我们通过报告不仅在正面图像上(如在先前工作中)而且在整个面部姿势频谱上不仅在合成低分辨率图像上(如在先前工作中)报告良好的结果来说明联合训练两个网络的好处而且还可以显示真实图像(c)通过提出一种新的基于残差的架构,我们改进了人脸超分辨率的最新技术。 (d)从数量上看,我们在人脸超分辨率和对齐方式方面都显示出比现有技术有很大的提高。 (e)定性地,我们首次在现实世界中的低分辨率图像上显示出了良好的效果,如图1所示。背景:超分辨的同时进行地标检测
方法:通过集成子网通过热图损失实现人脸对齐并优化新型热图损失,从而将结构信息整合到基于GAN的超分辨率算法中。
结论:从数量上看,我们在人脸超分辨率和对齐方式方面都显示出比现有技术有很大的提高。 (e)定性地,我们首次在现实世界中的低分辨率图像上显示出了良好的效果,如图1所示。
引出面部超分辨和面部对齐的联系
如何同时解决超分辨和面部检测
-尝试同时解决这两个任务确实是一个鸡与蛋的问题:一方面,已经能够检测出面部标志对于面部超分辨率是有益的[34,30];然而,如何在任意姿势下实现低分辨率的脸仍然是一个尚待解决的问题[4]。另一方面,如果一个人可以有效地在整个面部姿势谱中超分辨低质量和低分辨率的面部,则可以高精度地定位面部地标。
人脸分辨率过小时候,很难进行面部定位
面部定位不准确会导致超分辨图像出现伪影
我们的贡献就是对于任意姿势的非常低的面部,也可以同时执行人脸超分辨和面部定位
使用感知损失待替逐像素损失
在特征图上使用MSE,而不是在像素上使用MSE(在超分辨和地面真实HR图像之间),即知觉损失。
值得注意的是,我们还使用了感知损失法。最近,在[20]中,作者提出了基于GAN的方法[7],该方法使用区分器来区分超分辨图像和原始HR图像以及知觉损失。在[26]中,提出了基于补丁的纹理损失以提高重建质量。上述方法是通用方法,不包含先验信息。但是在人脸领域需要处理分辨率很小的图像。
注意,上述所有图像超分辨率方法都可以应用于所有类型的图像,因此不包含面部特有信息,这在我们的建议中工作。同样,在大多数情况下,目标是在给定具有良好分辨率(通常为128×128)的图像的情况下生成高保真图像,而人脸超分辨率方法通常会处理分辨率很低的人脸(16×16或32)的结果×32)。
从上述所有方法中,我们的工作与[15]和[20]密切相关。特别地,我们的贡献之一是描述一种改进的基于GAN的超分辨率体系结构,我们将其用作强大的基线,并在此基础上构建了集成的人脸超分辨率和对齐网络。
人脸超分辨[32]的最新工作使用一种基于GAN的方法(如[20]的方法,没有知觉损失)来超分辨率极低分辨率的人脸。该方法被证明适用于从中取出的正面和预先对准的人脸CelebA数据集[21]。在[33]中,同一作者提出了两步解码器-编码器-解码器体系结构,该体系结构包含空间变压器网络以消除平移,缩放和旋转未对准。他们的方法在来自CelebA的前部数据集的预对齐,合成生成的LR图像上进行了测试[21]。值得注意的是,我们的网络并没有试图消除歧义,而是简单地学习了如何进行超分辨,并通过整合具有里程碑意义的本地化子网来重新指定人脸的结构。
提出问题:必须解决模糊图像的地标定位问题
[34],它以交替的方式执行面部超分辨率和密集面部对应
。他们的算法在PubFig [18]和Helen [19]的正面进行了测试,而对真实图像的结果很少(总共4个)也没有成功。与我们的工作的主要区别在于,在[34]中,稠密对应算法不是基于神经网络,而是基于级联回归,是从超分辨率网络中脱节预先学习的,并且保持固定。这样,[34]遭受了同样的问题,即必须在模糊的面部上检测地标,这对于算法的第一次迭代尤为明显。相反,我们建议在端到端的方式中同时学习超分辨率和人脸地标定位,并只用一个镜头联合超分辨图像并定位人脸地标。参见图2。如我们所示,这将大大提高性能,并在整个面部姿势频谱中生成高保真度的图像。我们使用的数据集不是正面的,而是包含各种姿势
在高分辨率图像上训练好的网络,处理低分遍人脸对齐时性能下降很大。我们在已有对齐网路的基础上,与超分辨网络共同训练,可以提升效果。
图2:拟议的Super-FAN体系结构包括三个连接的网络:第一个网络是新提议的超分辨率网络(请参见4.1小节)。第二个网络是基于WGAN的鉴别器,用于区分超分辨图像和原始HR图像(请参见第4.2小节)。第三个网络是FAN,这是一个面部对齐网络,用于在超分辨的面部图像上定位面部界标,并通过新引入的热图损失来提高超分辨率(请参见第4.3节)。
图3:提议的超分辨率架构(左)与[20]中描述的架构(右)之间的比较。另请参阅第4.1节。
图4:在LS3D-W上的视觉结果。注意:(a)拟议的Ours像素特征已经提供了比SR-GAN [20]更好的结果。 (b)通过额外添加新提议的热图损失(Ours-pixel-feature-heatmap),生成的脸部结构更好,看起来更加逼真。 Ours像素特征热图GAN是超级粉丝,它通过增加GAN损耗并通过端到端训练来改善我们的像素特征热图。最好以电子格式查看。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。