NAFNet(ECCV 2022)-图像修复论文解读
创始人
2024-01-22 04:17:35
0

文章目录

  • 解决问题
  • 算法
    • 背景
    • Simple Baseline
      • Plain Block
      • 归一化
      • 激活函数
      • Attention机制
      • 总结
    • NAFNet
      • SimpleGate替换GELU
      • SCA替换CA
      • 总结
  • 实验
  • 应用
    • RGB图像去噪
    • 图像去模糊
    • RAW图像去噪
  • 结论

论文: 《Simple Baselines for Image Restoration》
github: https://github.com/megvii-research/NAFNet

解决问题

目前图像复原领域SOTA方法复杂度比较高,这不利于分析和方法比较;作者提出简单网络NAFNet,发现激活函数非必须,在GoPro、SIDD取得SOTA。

算法

背景

block间通常通过有两种方式,如图2所示:
1、不同feature map之间进行联系;
2、多阶段网络,后一个阶段精细化前一个阶段结果;
在这里插入图片描述
block内设计如图3a所示,多个反卷积attention机制,门控反卷积,swin transformer block、HINBlock
在这里插入图片描述
为了简化网络,作者使用常规图2c中U-Net结构

Simple Baseline

Plain Block

为了简化神经网络,作者提出PlainNet,使用最常见的模块,如图3b,之所以没有使用Transformer,是因为:
1、一些工作声称达到SOTA效果,Transformer不是必须的;
2、depthwise conv比self-attention机制更加简单;

归一化

BN(N/H/W通道计算均值方差)对于小batch统计量不稳定,IN可以避免此问题,但是一些工作展示IN(H/W通道计算均值方差)并不总是带来正向收益,需要finetune。随着Transformer的成功,LN(C/H/W通道计算均值方差)用于越来越多方法,因此作者使用LN至Plain Block,可以稳定训练过程。

激活函数

目前SOTA方法中存在趋势:使用GELU替换ReLU,在保持图像去噪性能的同时,也为图像去模糊带来了增益。

Attention机制

原生self-attention机制计算量随着特征图大小二次增长,swin transformer在固定大小局部window进行,可缓解计算量增加问题,然而缺少全局信息,原生channel attention(SE Network)满足要求:计算高效,同时具备全局信息;

总结

Simple Baseline结构如图2c,3c,每个组成部分很普通,比如:LN、GELU、CA,但它们组成的Baseliine超越之前SOTA。

NAFNet

作者想在保证性能前提下,进一步简化图3c中baseline,发现SOTA方法都使用GLU。

SimpleGate替换GELU

GLU如式1,GELU如式2,通过比较发现,GELU是GLU的特殊情况,同时 GLU本身包含非线性,基于此,作者提出SimpleGate,如式4,图4c,将feature map在channel维分为两部分,而后逐像素相乘。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

SCA替换CA

CA过程如图4a、式5,可重写为式6,简化为GLU类似形式,作者仅保留CA两个重要部分:聚合全局信息,channel维信息交互,提出SCA,如式7
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

Simple Baseline中,
1、SimpleGate替换GELU;
2、SCA替换CA;
得到简化后的NAFNe,其不包含任何激活函数(ReLU,GELU,Sigmoid)

实验

从PlainNet到simple baseline消融实验如表1;
在这里插入图片描述
从simple baseline到NAFNet的消融实验如表2,性能提升同时,速度加快;
在这里插入图片描述
表4验证不同block数量影响,当增大到72时,性能改进不明显;
在这里插入图片描述
表5验证SimpleGate中不同激活函数影响,发现激活函数非必要;
在这里插入图片描述

应用

RGB图像去噪

表6展示在图像去噪方向与SOTA方法比较,超越最佳结果Restormer0.28dB,同时计算量大幅降低。如图5,作者提出的方法可修复更多细节;
在这里插入图片描述
在这里插入图片描述

图像去模糊

在GoPro数据集图与SOTA方法比较如表7,可视化结果如图6
在这里插入图片描述
在这里插入图片描述

RAW图像去噪

实验结果如表8,可视化结果如图7。
在这里插入图片描述
在这里插入图片描述

结论

作者对基线进行分析发现非线性激活函数非必须,提出的NAFNet没有线性激活,虽然结构简单但是性能未下降。

相关内容

热门资讯

又遭村田起诉专利侵权,卓胜微:... 11月21日,卓胜微发布《关于公司及子公司涉及诉讼的公告》,披露公司及全资子公司遭株式会社村田制作所...
又道歉了!小米客服一句话引爆全... 一波未平,一波又起...... 一块潜水表,又把小米推上舆论的风口浪尖。 到底咋回事? 故事线拉回 ...
主动“撞车”+人为扩损骗保 犯... 今年以来,公安部会同金融监管总局开展打击金融领域黑灰产违法犯罪专项工作,对保险等领域违法犯罪进行重点...
市人大法制委员会开展法规表决前... 11月21日,市人大法制委员会、常委会法制工作委员会在湖北省地方立法研究和人才培养基地(华中科技大学...
中信银行:践行“枫桥经验” 多... 践行“枫桥经验” 多元化解纠纷
落网!柬埔寨“假扮宪兵”犯罪团... 柬埔寨金边警方日前逮捕了一群冒充宪兵绑架、勒索游客的犯罪分子。该犯罪团伙冒充柬埔寨宪兵,专门绑架并勒...
杨浦检察院公益诉讼瞄准监管盲点... 月子会所跑路、疏于照顾发生安全事故的新闻近年来频频见诸报端,杨浦区检察院在工作中发现,有母婴机构涉及...
闪婚后发现妻子隐瞒2年精神分裂... 近日,河南省新野县人民法院审理了一起案件。原告小刘(男)和被告小张(女)于2025年1月经人介绍相识...
中葡法律合作迈出新步伐!超50... 南都讯 11月19日至21日,葡语律师同盟(FALP)大会在澳门举行,与会代表团一行深入考察横琴粤澳...
视觉中国被摄影师起诉案尘埃落定... 央广网北京11月22日消息(总台中国之声记者江晓晨)据中央广播电视总台中国之声《新闻纵横》报道,11...