本文提出了一种基于应用偏好对 SDEM 进行评价(选择)的框架
不同 SDA 在不同类型应用上的影响表现是不同的,因此选择为应用选择合适的 SDA 是重要的。这引出了 SDEM 。由于不同 SDEM 对同一个 SDA 的评估结果具有不一致性,且现有 SDEM 未考虑 SDA 在应用中的表现。为了消除这些 SDEM 评价结果的不一致性影响,本文提出一个基于应用的 meta-metric 来评估 SDEM。 本文的 meta-metric 基于特定应用 CBIR 。
论文:Meta-metric for saliency detection evaluation metrics based on application preference
概述
- 根据 SDAk,对数据集中每个图片进行 Saliency weighted CBIR,得到 Lk
- 计算 mAPk 得到 SDAk 在CBIR 中的准确度
- 将所有 mAPk 进行排序得到 SDA 在CBIR 中的表现排序 ˆX
- 使用 SDEMb 计算 SDAk 的 SMavg,得到 SDA 的评估排序 Xb
- 计算 Xb 和 ˆX 的相关系数 Yb 作为 SDEMb 的评估值
Saliency weighted CBIR
从 ResNet-152 的 res5c 层中每张图抽取 DCF [14],其包含 C=2048 个 feature map
使用 SDAk 生成每张图的 SM
计算每张图的 SWDk。按空间位置 (x,y) 关联 SM(sal) 和每个 DCF(f),采用简单的加权启发式结合二者,H、W 为 SM 的高、宽,ψ1(I) 的维度为 C=2048
ψ1(I)=H∑y=1W∑x=1sal(x,y)∗f(x,y)使用 L2 距离将 SWF 标准化,得到 ψ2
ψ2(I)=ψ1(I)||ψ1(I)||2使用 PCA 压缩和白化处理 SWF 标准化结果,得到白化向量 ψ3(I)
将白化向量标准化,得到 SWD ψ4(I)
通过计算两张图的 SWD 的标量积,得到两张图的相似度
- 根据数据集图片与查询图片 Ii 的相似度,得到图片 Ii 的检索结果有序列表
采用 SDAk,对每张图进行上述 CBIR,得到 N 张图片的检索结果有序列表,记 Lk 为SDA k 的检索结果有序集合
Lk={q1,q2,..,qN}将数据集中提供的每个图片的检索有序列表的集合,记为 ˆL ,(即 ground-truth
)
评价 SDEM
计算 SDA 平均精度
mAPk=∑iAPk(qi)N,i=1,2,..,NAPk(qi)=∑lj∈ˆL(qi)Precision(lj,Lk(qi))|ˆL(qi)|,j=1,2,..,|ˆL(qi|lj 的 ground-truth
中对应搜索图片 Ii 所得的有序列表中 第 j 个图片。mAPk 越大,SDAk 越好
计算每个 SDAk 的 mAPk ,得到 mAPk|k=1,2,..N,本文中取 N=10 种SDA,排序后得到各 SDA 在 CBIR 中的表现顺序,记 ˆX
计算 SDEM 相关系数
使用 SDEMb 评估 SDAk,(k∈1,..10) 的每张SM,取其平均值,排序 k 个平均值得到 Xb,计算 Xb 和 ˆX 的关系系数 Yb
Yb=1−6∗∑k(ˆX(k)−Xb(k))2(n+1)∗n∗(n−1)其中 k=1,2…10 表示本文中采用了 10 种 SDA,b=1,2,..,24 表示本文中使用的 24 种SDEM。对 Yb 进行排序,可得到对于 CBIR 最合适的 SDEM。
实验
数据集:三个, MSRC [33], COSDATA [16], and IID [31], Oxford Building dataset [27]作为对比时用
SDA:十种, HS [18], MST [38], CA [13], FT [1], RC [6], SMD [24], TD [7], MR [44], SO [48], and BSCA [45]
SDEM:四种传统的(PR-AUC, ROC-AUC, OR,and WF ),20 个 FR-IQA(…)
对比对象:[22] 中提出的 meta-metric
实验结果:本文因子计算出ROC-AUC为CBIR中最佳的SDEM,而 [22] 中WF为最佳的因子,故通过对比ROC-AUC和WF来评价本文的 meta-metric 和[22]中的 meta-metric 。使用 Oxford Building dataset 进行对比。ROC-AUC 与 Oxf_result(ground-truth)之间的 SROCC 为 0.81,大于 WF 和 Oxf_result 之间的 SROCC 0.52,故本文的meta-metric 更可靠。而且 24 种 SDEM 使用该数据集上进行 CBIR 得到的表现排序 Oxford_ranking 和本文的 meta-metric 计算出的在其他三个数据集上的 average_ranking 之间具有 0.8574 的SROCC,进一步表示本文 meta-metric 的可靠性。
术语
SDA:saliency detection algorithm 显著性检测算法
SDEM:saliency detection evaluation metric 显著性检测评价因子
mAP: mean average precision 平均精度。 测量检索结果准确度的数值
CBIR:content-based image retrieval 基于内容的图片检索