天天看点

全景分割调研(1) 问题引入与性能指标

文章目录

    • 0. 前言
    • 1. 问题引入
      • 1.1 要解决什么问题
      • 1.2 用了什么方法
      • 1.3 还存在什么问题&可借鉴之处
    • 2 性能指标
      • 2.1 对于性能指标的要求
      • 2.2 PQ 的定义与实现
      • 2.3 COCO 中的细节

0. 前言

  • 全景分割调研系列文章分为4篇
    • 问题引入与性能指标(本文)
    • 常用数据集
    • 当前研究现状(现有模型概况与分类、开源情况)
  • 本文主要内容
    • 全景分割的引入(也就是这篇论文的笔记)
    • 全景分割常用性能指标介绍

1. 问题引入

  • 相关资料:
    • arxiv
    • github
    • 论文解读,知乎讨论
  • 论文基本信息
    • 领域:全景分割(挖坑作)
    • 作者单位:FAIR
    • 发表时间:2018.1-CVPR2019
  • 一句话总结:全景分割开山之作,介绍了问题的定义、性能指标以及baseline方法(该方法没有什么价值)

1.1 要解决什么问题

  • 引入全景分割
    • 下图对比了语义分割、实例分割和全景分割。
    • 全景分割可以看成是语义分割和实例分割的结合:things使用实例分割,stuff使用语义分割。
    • 换句话说,things区分个体,stuff不区分个体。
全景分割调研(1) 问题引入与性能指标
  • 作者认为:
    • 相比于语义分隔与实例分割,全景分割是一种更符合人类认知的感知问题。
    • 相关问题研究不多,一个重要原因在于,没有合适的性能指标。
  • things 与 stuff
    • things:countable objects,即可计数物体,如人、车等,常见算法包括目标检测、实例分割。
    • stuff:amorphous regions of similar texture or material,即背景,如草地、天空、路面等,常见算法包括语义分割。
  • 问题定义(task format)很简单:每个像素都对应一个语义标签(stuff)或实例编号(things)

1.2 用了什么方法

  • 本文提出了适用于全景分割的性能指标PQ,下一章中单独介绍。

1.3 还存在什么问题&可借鉴之处

  • 开山之作,模型本身没有价值,但问题定义与性能指标都沿用至今。
  • 论文中还有一些别的内容
    • 比如人类一致性,不是特别明白是什么意思,有什么作用。

2 性能指标

  • 参考上面的论文以及 COCO Panoptic Evaluation

2.1 对于性能指标的要求

  • Completeness:需要同时对 stuff 和 things 进行评估
  • Interpretability:可解释,即人可以理解这个指标的含义
  • Simplicity:简洁,易于定义和实现

2.2 PQ 的定义与实现

  • 定义的性能指标名为 Panoptic Quality,简称 PQ。
  • PQ 包含两部分内容
    • segment mathing,分割匹配,换句话说,就 prediction 与 GT 进行匹配
    • PQ computation given the matches,通过匹配结果计算 PQ 值
  • segment matching
    • 当预测结果与 GT 的 IoU 大于 0.5 时,才算成功匹配
    • 每个 GT segment 只能有一个匹配
    • 实验证明,降低 IoU 阈值没有必要,因为很少有<0.5的匹配结果
  • PQ 计算
    • 对每一类分别计算,然后最后求平均。这样做有利于是的类别间均衡(即不同类别的权重差不多)
    • 对于所有预测和GT,有三种可能的结果
      • TP,true positive,matched pairs of segments
      • FP,false positive,unmatched predicted segments
      • FN,false negative,unmatched ground truth segments
    • PQ 的公式如下
      • 下面两个公式是等价的。
      • 第二个公式有更好的可解释性(保证了PQ的Interpretability)。
      • SQ 代表分割质量,是TP中GT/Predict之间IoU之和,与所有 TP 的面积的比值,只计算 matched pairs
      • RQ 代表识别质量,定义与F1 Score相同
全景分割调研(1) 问题引入与性能指标
全景分割调研(1) 问题引入与性能指标
  • 在计算PQ的过程中,对于 things,每一个实例可以看成是 stuff 中的单独一类。
    • 这保证了 PQ 的Completeness

2.3 COCO 中的细节

  • COCO 中的性能指标如下
    • 分别计算每一类的PQ/SQ/RQ
    • 计算每一类Things的PQ/SQ/RQ
    • 计算每一类stuff的PQ/SQ/RQ
全景分割调研(1) 问题引入与性能指标

继续阅读