全景分割调研(1) 问题引入与性能指标

文章目录

- 0. 前言
- 1. 问题引入
- - 1.1 要解决什么问题
  - 1.2 用了什么方法
  - 1.3 还存在什么问题&可借鉴之处
- 2 性能指标
- - 2.1 对于性能指标的要求
  - 2.2 PQ 的定义与实现
  - 2.3 COCO 中的细节

0. 前言

全景分割调研系列文章分为4篇
- 问题引入与性能指标（本文）
- 常用数据集
- 当前研究现状（现有模型概况与分类、开源情况）
本文主要内容
- 全景分割的引入（也就是这篇论文的笔记）
- 全景分割常用性能指标介绍

1. 问题引入

相关资料：
- arxiv
- github
- 论文解读，知乎讨论
论文基本信息
- 领域：全景分割（挖坑作）
- 作者单位：FAIR
- 发表时间：2018.1-CVPR2019
一句话总结：全景分割开山之作，介绍了问题的定义、性能指标以及baseline方法（该方法没有什么价值）

1.1 要解决什么问题

引入全景分割
- 下图对比了语义分割、实例分割和全景分割。
- 全景分割可以看成是语义分割和实例分割的结合：things使用实例分割，stuff使用语义分割。
- 换句话说，things区分个体，stuff不区分个体。

全景分割调研(1) 问题引入与性能指标

作者认为：
- 相比于语义分隔与实例分割，全景分割是一种更符合人类认知的感知问题。
- 相关问题研究不多，一个重要原因在于，没有合适的性能指标。
things 与 stuff
- things：countable objects，即可计数物体，如人、车等，常见算法包括目标检测、实例分割。
- stuff：amorphous regions of similar texture or material，即背景，如草地、天空、路面等，常见算法包括语义分割。
问题定义（task format）很简单：每个像素都对应一个语义标签（stuff）或实例编号（things）

1.2 用了什么方法

本文提出了适用于全景分割的性能指标PQ，下一章中单独介绍。

1.3 还存在什么问题&可借鉴之处

开山之作，模型本身没有价值，但问题定义与性能指标都沿用至今。
论文中还有一些别的内容
- 比如人类一致性，不是特别明白是什么意思，有什么作用。

2 性能指标

参考上面的论文以及 COCO Panoptic Evaluation

2.1 对于性能指标的要求

Completeness：需要同时对 stuff 和 things 进行评估
Interpretability：可解释，即人可以理解这个指标的含义
Simplicity：简洁，易于定义和实现

2.2 PQ 的定义与实现

定义的性能指标名为 Panoptic Quality，简称 PQ。
PQ 包含两部分内容
- segment mathing，分割匹配，换句话说，就 prediction 与 GT 进行匹配
- PQ computation given the matches，通过匹配结果计算 PQ 值
segment matching
- 当预测结果与 GT 的 IoU 大于 0.5 时，才算成功匹配
- 每个 GT segment 只能有一个匹配
- 实验证明，降低 IoU 阈值没有必要，因为很少有<0.5的匹配结果
PQ 计算
- 对每一类分别计算，然后最后求平均。这样做有利于是的类别间均衡（即不同类别的权重差不多）
- 对于所有预测和GT，有三种可能的结果
  - TP，true positive，matched pairs of segments
  - FP，false positive，unmatched predicted segments
  - FN，false negative，unmatched ground truth segments
- PQ 的公式如下
  - 下面两个公式是等价的。
  - 第二个公式有更好的可解释性（保证了PQ的Interpretability）。
  - SQ 代表分割质量，是TP中GT/Predict之间IoU之和，与所有 TP 的面积的比值，只计算 matched pairs
  - RQ 代表识别质量，定义与F1 Score相同

全景分割调研(1) 问题引入与性能指标

在计算PQ的过程中，对于 things，每一个实例可以看成是 stuff 中的单独一类。
- 这保证了 PQ 的Completeness

2.3 COCO 中的细节

COCO 中的性能指标如下
- 分别计算每一类的PQ/SQ/RQ
- 计算每一类Things的PQ/SQ/RQ
- 计算每一类stuff的PQ/SQ/RQ

全景分割调研(1) 问题引入与性能指标

全景分割调研(1) 问题引入与性能指标

文章目录

0. 前言

1. 问题引入

1.1 要解决什么问题

1.2 用了什么方法

1.3 还存在什么问题&可借鉴之处

2 性能指标

2.1 对于性能指标的要求

2.2 PQ 的定义与实现

2.3 COCO 中的细节

继续阅读

1、数据驱动的图像分类方法

python图片切割与合并

python画热力图（相关系数矩阵图）

MFC中使用CUDA5.0的方法（VS2010环境）

Xshell中使用openCV显示图片1. 问题描述2. 包的安装3. Xmanager

GoogLeNet网络结构详解及代码复现

MATLAB环境下使用惯性传感器进行步态周期验证和分割算法运行环境为MATLABR2018A，使用惯性传感器进行步态周期

c++求集合幂集

使用python先后截两张图，并打印出两张图的差异图片

论文阅读——DA-Net:Dual Attention Network forScene Segmentation摘要Section I IntroductionSection II Related workSection III DA-NetSection IV ExperimentsSection V 实验结果分析Section VI Conclusion

OpenCV-Python 笔记（四）Canny边缘检测、图像金字塔

Opencv之直方图

（Python+OpenCV）直方图均衡化

[MICCAI2019] Learning shape priors for robust cardiac MR segmentation from multi-view images

Linux下安装OpenCV 3.0

Holistically-Nested Edge Detection读书笔记