本文贡献:
1. 首次将超像素分割应用于 BIQA 中,提取局部特征和多尺度语义特征。
2. 分析了图像裁剪训练对完整图像评价的影响,调整了图像拼接层,设计了一个能够克服图像大小问题的模型。
3. 方法配合得很好,每个部分都互相配合。实验结果表明,该方法在预测图像质量和处理复杂畸变图像方面性能更好。
1.本文方法
1.1模型框架
多尺度特征提取(包含语义信息)、超像素网络(基于CNN的超像素分割,使深层神经网络能够感知局部超像素区域)
1.2 语义特征提取
为了提取语义特征,使特征更加全面,我们采用了预训练的 resnet-50作为骨干网络。为保持主成分和快速计算,应用1×1卷积层,平均池化层,全连接层对多尺度特征进行细化。
要求输入图像的预处理不应修改图像本身的主要内容和质量,在图像大小不同的情况下,我们的模型必须可用于任意大小而不影响质量。我们用自适应池取代了平均池和最大池,GMP和 GAP 可以看作是自适应池的一个特例。
1.3 超像素图的生成网络
1.3.1 超像素分割
网络是由五层的 cnn 设计的,分割过程能被简单的表示为
S(x)代表整个网络,x代表大小为H×W的输入图像。删除了 操作,它用于将超像素概率映射转换为可见的超像素以进行视觉欣赏,在实验中可视的超像素是不需要的,直接用超像素概率图。使用默认参数,最大像素数设为100。
1.3.2 生成超像素映射图
在超像素分割后,得到大小为 n × h × w 的概率表示映射 p。设计一个图生成模型来生成超像素邻接图。利用3 × 3卷积层来获取有意义的特征,然后应用自适应最大池技术使网络适用于任意大小。根据特征的表示方式,分别设计了两个不同的分支,分别适合局部特征和整体特征。利用多尺度特征和超像素邻接图,将它们与直接乘法相结合,将混合特征输入 fc 层进行最终评分预测。
2 模型训练
2.1 实验细节
数据库中根据图像的原始大小测试了不同大小的图像,但是在同一个数据库中,所有训练图像的大小都是一样的。我们使用了权重衰减率 λ = 0.0005的 adam化器。
和
补丁损失和原始补丁损失,W表示所有训练补丁。
2.2 损失函数
对于卷积神经网络,随机梯度下降和向后传播被广泛用于计算梯度和更新参数。损失函数作为整个网络的索引。我们最小化 l1损失,它描述了预测得分与训练集的真值得分之间的绝对误差
Xi表示第i个训练补丁,Qi表示它的真实分数,代表训练模型,M代表输入例子的数量