Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

2023-04-12 05:32:40

筆者最近在關注fine-grained方面的paper，發現有以下的方面去做：

1 part-based

2 weakly-supervised的，如second-orderless pooling（Compact Bilinear Pooling）等

3 還是weakly-supervised的，但用上了proposals/grids/regions（如selective search）等，在網絡中同時做classification和detection。

該論文Improving Facial Attribute Prediction using Semantic Segmentation, In arXiv， 2017.04.同樣是怎麼利用image-level的labels，如人臉屬性來做人臉屬性分類的。

本博文除了該論文，還會涉及到另外一篇論文Weakly Supervised Deep Detection Networks. In CVPR, 2016.

廢話少說，當然細節的東西還是各自看論文去。

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

由于這次的重點不是說論文裡面的face parsing。至于怎麼做face parsing的，還是看論文去。上面的圖1的一個前提條件是，已經訓練好face parsing net的了，而且由這個net來提供face的parsing maps。在做face attr分類時，parsing maps直接resize到對應conv feature maps的大小。

圖1的b）和c）挺有意思的，但是從論文上看SSG的作用不大。不管怎樣，SSG和SSP的目的是，利用parsing的結果來refine分類模型學到的feature map，使得模型能夠充分利用spatial information（一般的做法是在最後一層做global pooling，這顯然是spatial orderless的）：即每個feature map隻響應一個對應part region（這裡用parsing來表示）。

筆者比較感興趣的是SSP，是以在這裡就說下Weakly Supervised Deep Detection Networks. In CVPR, 2016.

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

這裡需要弄清楚的一個概念是，detection branch，其實和classification branch是沒有太大差別，差別在于如何做softmax的：

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

classification的目的是，判斷該region會是哪個類别，而detection的目的是，判斷某個類别會在哪些region出現，非常make sense。

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

這個就是網絡的架構圖，具體的細節看論文去。

整體上，這樣做都是為了學到更好的特征，而且是在weakly-supervised的限制下。至于有沒有效果，就看你怎麼用了。

===== 如果這篇博文對你有幫助，可否賞筆者喝杯奶茶？

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

CVPR Deep Learning Classification fine-graind

上一篇: 資料結構（三）:非線性邏輯結構-特殊的二叉樹結構：堆、哈夫曼樹、二叉搜尋樹、平衡二叉搜尋樹、紅黑樹、線索二叉樹一、概念總攬

下一篇: Java資料結構與算法--紅黑樹

繼續閱讀