Meta-metric for saliency detection evaluation metrics based on application preference

本文提出了一种基于应用偏好对 SDEM 进行评价(选择)的框架

不同 SDA 在不同类型应用上的影响表现是不同的,因此选择为应用选择合适的 SDA 是重要的。这引出了 SDEM 。由于不同 SDEM 对同一个 SDA 的评估结果具有不一致性,且现有 SDEM 未考虑 SDA 在应用中的表现。为了消除这些 SDEM 评价结果的不一致性影响,本文提出一个基于应用的 meta-metric 来评估 SDEM。 本文的 meta-metric 基于特定应用 CBIR

论文:Meta-metric for saliency detection evaluation metrics based on application preference


概述

  • 根据 $SDA_{k}$,对数据集中每个图片进行 Saliency weighted CBIR,得到 $L_{k}$
  • 计算 $mAP_{k}$ 得到 $SDA_{k}$ 在CBIR 中的准确度
  • 将所有 $mAP_{k}$ 进行排序得到 SDA 在CBIR 中的表现排序 $\hat{X}$
  • 使用 $SDEM_{b}$ 计算 $SDA_{k}$ 的 $SM_{avg}$,得到 SDA 的评估排序 $X_{b}$
  • 计算 $X_{b}$ 和 $\hat{X}$ 的相关系数 $Y_{b}$ 作为 $SDEM_{b}$ 的评估值

Saliency weighted CBIR

  • 从 ResNet-152 的 res5c 层中每张图抽取 DCF [14],其包含 $C=2048$ 个 feature map

  • 使用 $SDA_{k}$ 生成每张图的 SM

  • 计算每张图的 $SWD_{k}$。按空间位置 $(x,y)$ 关联 SM($sal$) 和每个 DCF($f$),采用简单的加权启发式结合二者,$H$、$W$ 为 SM 的高、宽,$\psi_{1}(I)$ 的维度为 $C=2048$

  • 使用 $L2$ 距离将 SWF 标准化,得到 $\psi_{2}$

  • 使用 PCA 压缩和白化处理 SWF 标准化结果,得到白化向量 $\psi_{3}(I)$

  • 将白化向量标准化,得到 SWD $\psi_{4}(I)$

  • 通过计算两张图的 SWD 的标量积,得到两张图的相似度

  • 根据数据集图片与查询图片 $I_{i}$ 的相似度,得到图片 $I_{i}$ 的检索结果有序列表

采用 $SDA_{k}$,对每张图进行上述 CBIR,得到 N 张图片的检索结果有序列表,记 $L_{k}$ 为SDA $k$ 的检索结果有序集合

将数据集中提供的每个图片的检索有序列表的集合,记为 $\hat{L}$ ,(即 ground-truth

评价 SDEM

计算 SDA 平均精度

$l_{j}$ 的 ground-truth 中对应搜索图片 $I_{i}$ 所得的有序列表中 第 $j$ 个图片。$mAP_{k}$ 越大,$SDA_{k}$ 越好

计算每个 $SDA_{k}$ 的 $mAP_{k}$ ,得到 ${mAP_{k} |k=1,2,..N}$,本文中取 $N=10$ 种SDA,排序后得到各 SDA 在 CBIR 中的表现顺序,记 $\hat{X}$

计算 SDEM 相关系数

使用 $SDEM_{b}$ 评估 $SDA_{k}, (k\in{1,..10})$ 的每张$SM$,取其平均值,排序 $k$ 个平均值得到 $X_{b}$,计算 $X_{b}$ 和 $\hat{X}$ 的关系系数 $Y_{b}$

其中 $k=1, 2…10$ 表示本文中采用了 10 种 SDA,$b=1,2,..,24$ 表示本文中使用的 24 种SDEM。对 $Y_{b}$ 进行排序,可得到对于 CBIR 最合适的 SDEM。

实验

数据集:三个, MSRC [33], COSDATA [16], and IID [31], Oxford Building dataset [27]作为对比时用
SDA:十种, HS [18], MST [38], CA [13], FT [1], RC [6], SMD [24], TD [7], MR [44], SO [48], and BSCA [45]
SDEM:四种传统的(PR-AUC, ROC-AUC, OR,and WF ),20 个 FR-IQA(…)
对比对象:[22] 中提出的 meta-metric

实验结果:本文因子计算出ROC-AUC为CBIR中最佳的SDEM,而 [22] 中WF为最佳的因子,故通过对比ROC-AUCWF来评价本文的 meta-metric 和[22]中的 meta-metric 。使用 Oxford Building dataset 进行对比。ROC-AUC 与 Oxf_result(ground-truth)之间的 SROCC 为 0.81,大于 WF 和 Oxf_result 之间的 SROCC 0.52,故本文的meta-metric 更可靠。而且 24 种 SDEM 使用该数据集上进行 CBIR 得到的表现排序 Oxford_ranking 和本文的 meta-metric 计算出的在其他三个数据集上的 average_ranking 之间具有 0.8574 的SROCC,进一步表示本文 meta-metric 的可靠性。

术语

SDA:saliency detection algorithm 显著性检测算法
SDEM:saliency detection evaluation metric 显著性检测评价因子
mAP: mean average precision 平均精度。 测量检索结果准确度的数值
CBIR:content-based image retrieval 基于内容的图片检索

0%