当前位置:首页 » 《关注互联网》 » 正文

Github 4.8k Stars! | CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)

4 人参与  2024年04月18日 11:45  分类 : 《关注互联网》  评论

点击全文阅读


点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

f97100a040dbdd701addff5fed4c2c3a.gif

694bf11c149f525b3d318b36ba074f69.gif

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

项目地址:https://shangchenzhou.com/projects/CodeFormer/#method

4fae289b91c020cb1ed751f1565abd8b.png

先来一组效果图:

转换前:93376b838348ac9da137587b606b7c05.png

转换后:ce5e6427321276d8baea9ea0892e5f2f.png

计算机视觉研究院专栏

Column of Computer Vision Institute

模糊的脸恢复是一个高度不适定的问题,通常需要辅助指导来:1)改进从退化输入到期望输出的映射,或者2)补充输入中丢失的高质量细节。

ba7e5ac43fcc155c66ee10d3c48f1938.gif

PART/1

     概述    

模糊的脸恢复是一个高度不适定的问题,通常需要辅助指导来:1)改进从退化输入到期望输出的映射,或者2)补充输入中丢失的高质量细节。在今天分享中,我们证明了在小proxy空间中学习的离散码本先验通过将人脸盲恢复作为代码预测任务,大大降低了恢复映射的不确定性和模糊性,同时为生成高质量人脸提供了丰富的视觉原子。在这种范式下,我们提出了一种基于Transformer的预测网络,称为CodeFormer,用于对低质量人脸的全局组成和上下文进行建模,以进行代码预测,从而即使在输入严重退化的情况下,也能够发现与目标人脸非常接近的自然人脸。为了增强对不同退化的适应性,我们还提出了一个可控的特征转换模块,该模块允许在保真度和质量之间进行灵活的权衡。得益于富有表现力的码本先验和全局建模,CodeFormer在质量和保真度方面都优于现有技术,表现出对退化的超强鲁棒性。在合成和真实世界数据集上的大量实验结果验证了我们方法的有效性。

PART/2

     概述    

各种先验已被用于缓解该问题的不适定性,包括几何先验、参考先验和生成先验。尽管观察到纹理和细节有所改善,但这些方法往往对退化敏感度高或先前的表现力有限。这些先验为人脸恢复提供了不足的指导,因此它们的网络本质上依赖于通常高度破坏的LQ输入图像的信息。结果,LQ-HQ映射不确定性仍然存在,并且输出质量由于输入图像的劣化而劣化。最近,基于生成先验,一些方法通过迭代潜在优化或直接潜在编码将退化的人脸投影到连续的无限空间中。尽管输出非常真实,但在严重退化的情况下,很难找到准确的潜在矢量,导致低保真度结果(下图(d)段)。为了提高保真度,在这类方法中通常需要编码器和解码器之间的跳过连接,如下图所示。然而,当输入严重退化时,这种设计同时会在结果中引入伪影,如下图(e)所示。

fc285b386b77e3b0855c173364f5ff69.png

PART/3

     新框架新方法    

52b366bbceb40eef1ff9615c9fbbfdc3.png

(a) 我们首先学习一个离散码本和解码器,通过自重构学习来存储人脸图像的高质量视觉部分。(b) 在固定码本和解码器的基础上,我们引入了一个Transformer模块用于码序列预测,对低质量输入的全局人脸组成进行建模。此外,一个可控的特征变换模块用于控制从LQ编码器到解码器的信息流。请注意,这种连接是可选的,可以在输入严重退化时禁用,以避免不利影响,并且可以调整标量权重w以在质量和保真度之间进行权衡。

390fc891cd19add9dfd39039c94a05b0.png

65db93835cb2c4df4f0a0ed299b515ce.png

PART/4

     实验及可视化    

7c55d824317cda057010b861b00ca58a.png

9b9940b4c38b8fdab95354730d36a1a3.png

ed3ba38c282d5b4ac38c2f5720430d5b.png

78d4767d8afdd146d632498d9b5595b1.gif

END

79188e30c9e0d62b4ac90576f08c4fb5.gif

59db7c80e3ae18c5ffc674e1e7265f75.gif

转载请联系本公众号获得授权

6ee481e2ae0cf03183720725ef8b5ad1.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

fb7c835b7274badf1a8d05f6b95180b2.png

 往期推荐 

?

Drone-YOLO:一种有效的无人机图像目标检测

机场项目:解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

2PCNet:昼夜无监督域自适应目标检测(附原代码)

YOLO-S:小目标检测的轻量级、精确的类YOLO网络

大改Yolo框架 |  能源消耗极低的目标检测新框架(附论文下载)

改进的检测算法:用于高分辨率光学遥感图像目标检测

小米平板6 Max-Yolo:在便携终端上实时检测不再是难题

旋转角度目标检测的重要性!!!(附源论文下载)

PE-YOLO:解决黑夜中的目标检测难点

EdgeYOLO:边缘设备上实时运行的目标检测器及Pytorch实现

Q-YOLO:用于实时目标检测的高效推理


点击全文阅读


本文链接:http://zhangshiyu.com/post/97009.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1