Improving Semantic Segmentation via Video Propagation and Label Relaxation

2023-04-14 02:41:11

一篇使用視訊資訊提升semantic segmentation 精度的工作，可以看成合理的進行data augmentation方法，文章試驗做的很全面，總體來說非常紮實。文章繼承了英偉達該組之前的sdc net (見本文附錄)的工作。

Methodology

使用SDC-net 預測某片段前後k 幀圖像motion vectors進而得到相應的image和label，增加了網絡的訓練資料。
物體邊緣的分割曆來是分割任務中比較難的地方，使用motion vectors可能存在預測不準的case更是加重了這種問題，文章緩解這種問題的方法如下圖：

Improving Semantic Segmentation via Video Propagation and Label Relaxation

其中C是某像素周圍3x3範圍gt存在的種類數，直覺來看softmax cross entropy中傾向于使單個類别的機率為1，本文中的label relaxation傾向于使得該像素成為相鄰gt中若幹類加在一起的機率為1，如果C隻取一類就是标準的cross entropy，如果取全部類别相當于ignore。

文章的cityscape baseline也比較強，使用了ma’pi’llary pretrin， Class Uniform Sampling，resnext 50 的deeplab v3 val集miou 79.46%，video propagation 和label relaxation各提高接近一個點。在camvid 和kitti這種小資料集上提升更明顯。

Appendices

Improving Semantic Segmentation via Video Propagation and Label Relaxation

對于 video prediction，文中提到vector based 集kernel based的方法。 vector based方法根據之前幀出現的位置resample，相當于學到了某個像素在之前幀的位置，這種方法的缺點是不能很好的應對之前幀不存在的區域；另外 kernel based的方法根據之前幀相鄰範圍像素的關系得到目前幀的像素值，這樣由于kernal的限制不利于捕捉遠距離的移動關系。文中的sdc結合了以上兩者的優點，同時做vector 集kernel的學習。

Improving Semantic Segmentation via Video Propagation and Label Relaxation

模型結構：

Improving Semantic Segmentation via Video Propagation and Label Relaxation

loss function：

除了pixel的l1 loss還用了以下loss：

Improving Semantic Segmentation via Video Propagation and Label Relaxation

L perceptual是用vgg等model的feature來限制。

Lstyle 是考慮feature的channel之間的關系

可視化結果還是不錯的

Improving Semantic Segmentation via Video Propagation and Label Relaxation

Methodology

Appendices

繼續閱讀

Meta-Transformer，一個多模态模型，其具有一個模态共享編碼器，無需配對資料，可以在12個不同模态上完成16

基于圖的圖像分割

[論文筆記] (CVPR2019) Structured Knowledge Distillation for Semantic Segmentation

轉置卷積/反卷積（Transpose Convolution/Deconvolution）詳解1、提出背景及其應用2、反卷積過程圖解3、反卷積數學推導4、輸出特征圖尺寸5、代碼實作（Numpy/Pytorch）

【雜談】夢想與餅幹，AI是你的誰？

ubuntu下MASK-RCNN運作記錄

halcon dots_image 點狀物提取 (by shany shang)源代碼：

超像素經典算法SLIC的代碼的深度優化和分析

Seeds超像素分割

keras Unet 細胞分割邊緣檢測代碼走讀

基于視覺的手勢識别系統（二）——展示和代碼

《ACFNet: Attentional Class Feature Network for Semantic Segmentation》論文筆記AbstractIntroduction二、MethodExperiments

FCN/MRF圖像語義分割與馬克爾夫随機場

Holistically-Nested Edge Detection讀書筆記

PALM病理性近視預測 2021-07-04飛槳正常賽：PALM病理性近視預測 6月第3名方案一、賽題介紹