論文筆記《Fully Convolutional Networks for Semantic Segmentation》

2016-07-26 21:25:00

一、Abstract

提出了一種end-to-end的做semantic segmentation的方法，也就是FCN，是我個人覺得非常厲害的一個方法。

二、亮點

1、提出了全卷積網絡的概念，将Alexnet這種的最後的全連接配接層轉換為卷積層，好處就是可以輸入任意的scale。

隻不過在輸出的scale不同的時候，feature map的大小也不同，因為這裡的目的是最piexl的語義分割，是以其實不重要。

在Alexnet基礎上, 最後的channel=4096的feature map經過一個1x1的卷積層, 變為channel=21的feature map, 然後經過上采樣和crop, 變為與輸入圖像同樣大小的channel=21的feature map, 也就是圖中的pixel-wise prediction。在Longjon的試驗中一共有20個語義類别, 加上背景類别每個像素應該有21個softmax預測類, 是以pixel-wise prediction中channel=21。

2、如何做上采樣的？

對CNN的輸出結果進行upsampling，上采樣的參數是可學習的，這裡采用的方法是反卷積，其實跟BP的求卷積層的梯度是一樣的算法，最後得到一個和原圖一樣大小的輸出，輸出結果為對每個像素的分類。

3、如何把全連接配接層轉換為卷積層？

這篇博文寫的很好http://blog.csdn.net/u010668083/article/details/46650877，這裡有一個概念我之前一直模糊了，把全連接配接層轉換為卷積層，實際上是用一個和輸入的圖像一樣大小的卷積核去做這個操作。對于一個7*7*512的cov輸出，連接配接到一個1*1*4096的全連接配接層，轉換的方法也就是：用4096組濾波器，每組濾波器有512組，每組的大小是7*7的（是以我的了解就是..這個濾波器的大小實際上是7*7*512），這樣的話，參數數量一緻，最後的輸出也是一緻的。在輸出變大的時候，因為是都是卷積層，最後當然可以得到一個上面那張圖的輸出。

4.refinement

作者發現，直接這樣做效果并不是很好，于是拿出了祖傳trick來解決問題了。

如下圖所示，在最後upsampling的時候，不隻用最後一層，還要結合前面幾層一起來做一個fusion，這個很好了解，前面幾層的感受野是比較小的，是以在局部的輸出結果上是不錯的，而後面的輸出感受野是越來越大的，可以說準确率會高一點，進行融合以後，效果好的飛起..

三、結論

語義分割方面FCN可以說是開了一個山頭了，我覺得這個想法很好，對于之後的instance segmentation也有很大的幫助。

論文筆記《Fully Convolutional Networks for Semantic Segmentation》

繼續閱讀

基于CNN的MNIST手寫數字識别

論文筆記 -《Machine vision technology for detecting the external defects of fruits - a review》1 文章背景2 摘要内容3 段落主旨

基于深度學習的車牌+車輛識别（YOLOv5和CNN）源碼加文末QQ基于深度學習的車牌識别(YOLOv5和CNN）目錄

融合RNN和CNN的文本分類模型

CNN文本分類原理講解與實戰

Pytorch學習筆記（8）———建構CNN網絡(下)

論文閱讀：CVPR2019 | CSPNet: A New Backbone that can Enhance Learning Capability of CNN前言一、Introduction二、Method三、 result總結

ICLR2017 paper: FASTER CNNS WITH DIRECT SPARSE CONVOLUTIONS AND GUIDED PRUNING 筆記

論文筆記 - Weighted Component Hashing of Binary Aggregated Descriptors for Fast Visual Search

【論文筆記】FM: Factorization Machines

（推薦系統） FM算法：Factorization Machines摘要1. FM模型2. FM如何解決資料的稀疏性3 FM的線性複雜度4.FM與其他算法的對比5 總結

[MICCAI2019] Learning shape priors for robust cardiac MR segmentation from multi-view images

[MICCAI2019] Unified Attentional Generative Adversarial Network for Brain Tumor Segmentation From Mu

深度學習之卷積神經網絡(CNN) — 理論與代碼結合

深度學習之卷積神經網絡CNN及tensorflow代碼實作示例詳細介紹(轉載) 深度學習之卷積神經網絡CNN及tensorflow代碼實作示例詳細介紹

論文閱讀筆記（三）：Research on Network Attack Effect Evaluation Based on Confrontational Perspective一. 論文簡介二. 創新點和貢獻：三. 相關領域的概述(related work)四. 作者的方案五. 主要的資訊流（approach）六. 總結