Q1:论文试图解决的问题
本文试图解决从低分辨率图片重建高分辨率图片的问题。传统上已有许多解决办法,但存在诸多弊端,传统方法上存在的一部分问题被本文提出的方法解决。
- 传统的稀疏编码方法运行速度慢,且需要将图片进行切割,每一部分单独还原。本文提出的轻量级模型能够快速重建图像,无需将图片进行切割处理,并能达到SOTA。
- 传统超分辨率方法重建图像需要众多步骤(pipeline),且每个步骤需要单独优化,本文提出的模型能够同时对所有层次同时进行优化。
- 传统超分辨率重建方法大多数仅能用于单一通道(灰度图像),本文提供的方法能够用于多个通道(RGB)。
Q2:这是否是一个新的问题?
并非新问题。在早期已有很多关于超分辨率的研究,包括通过数值计算的插值重建法、通过传统机器学习的稀疏编码、随机森林等方法。本文的意义在于对传统方法的重大改进。
Q3:这篇文章要验证一个什么科学假设?
- 新提出的SRCNN模型,在精度、速度上都能达到SOTA。
- 传统的稀疏编码模型,本质上和卷积神经网络等价。
Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
在本文提出的时间段之前,相关研究主要分为四种
- prediction model
- edge based methods
- image statistical methods(基于统计的方法 如图像插值等)
- example-based methods(基于样本的方法 机器学习 如稀疏编码超分辨率 在本文提出前是SOTA)
- 本文提出的基于卷积神经网络的方法(开创性论文)
值得关注的研究员:
高新波
Ming-Hsuan Yang
汤晓鸥
Q5 论文中提到的解决方案之关键是什么?
论文中SRCNN模型主要分为四个步骤,首先输入原始低分辨率图像,对低分辨率图像进行bicubic (双立方插值),得到目标大小的图像,接下来将图像传入卷积层。第一个卷积层用于提取低分辨率的图像特征,第二个卷积层使用1x1卷积核,进行非线性映射,最后一个卷积层将映射后的特征图进行重建,得到目标图像。
Q6论文中的实验是如何设计的?
首先实验不同数据集对模型的影响,接下来,改变网络的架构、滤波器数量、滤波器大小等因素,探究对性能的影响,并与传统的SOTA方法对比。由于传统方法只处理单通道,因此对比实验也仅使用单通道。最后,将模型应用于彩色图片上,评估性能。
Q7用于定量评估的数据集是什么?代码有没有开源?
使用的数据集为“ILSVRC 2013 ImageNet”(395,909 张图片),及来自"Image super-resolution via sparse representation "论文中提出的小数据集(91张图片)。
Q8论文中的实验及结果有没有很好地支持需要验证的科学假设?
本文的实验结果证明,使用CNN的方法进行超分辨率重建,效果和速度要远好传统的几种方法。
Q9这篇论文到底有什么贡献?
主要的贡献在如下三个方面:
- 提出了端到端的、基于卷积神经网络的超分辨率重建方法,该方法基本不需要任何的图像预处理。
- 建立了卷积神经网络和稀疏编码超分辨率方法之间的联系,解释了SRCNN各层的含义,这种解释为SRCNN层次设计提供了依据。
- 揭示了卷积神经网络在处理传统计算机视觉问题(超分辨率重建)上的有效性,并且可以达到很高的质量和速度。
Q10下一步呢?有什么工作可以继续深入?
- 损失函数可以加以改进,作者在文中提出,使用MSE并不能准确表达出图片在结构上的相似性,在有些情况下,图片复原效果不佳,但MSE反而更低。
- 文中指出使用更深的网络、更复杂的网络结构可以提高图像重建表现。但受限于当时的算力没有继续改进。