天天看點

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

筆者最近在關注fine-grained方面的paper,發現有以下的方面去做:

1 part-based

2 weakly-supervised的,如second-orderless pooling(Compact Bilinear Pooling)等

3 還是weakly-supervised的,但用上了proposals/grids/regions(如selective search)等,在網絡中同時做classification和detection。

該論文Improving Facial Attribute Prediction using Semantic Segmentation, In arXiv, 2017.04.同樣是怎麼利用image-level的labels,如人臉屬性來做人臉屬性分類的。

本博文除了該論文,還會涉及到另外一篇論文Weakly Supervised Deep Detection Networks. In CVPR, 2016.

廢話少說,當然細節的東西還是各自看論文去。

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

由于這次的重點不是說論文裡面的face parsing。至于怎麼做face parsing的,還是看論文去。上面的圖1的一個前提條件是,已經訓練好face parsing net的了,而且由這個net來提供face的parsing maps。在做face attr分類時,parsing maps直接resize到對應conv feature maps的大小。

圖1的b)和c)挺有意思的,但是從論文上看SSG的作用不大。不管怎樣,SSG和SSP的目的是,利用parsing的結果來refine分類模型學到的feature map,使得模型能夠充分利用spatial information(一般的做法是在最後一層做global pooling,這顯然是spatial orderless的):即每個feature map隻響應一個對應part region(這裡用parsing來表示)。

筆者比較感興趣的是SSP,是以在這裡就說下Weakly Supervised Deep Detection Networks. In CVPR, 2016.

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

這裡需要弄清楚的一個概念是,detection branch,其實和classification branch是沒有太大差別,差別在于如何做softmax的:

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

classification的目的是,判斷該region會是哪個類别,而detection的目的是,判斷某個類别會在哪些region出現,非常make sense。

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

這個就是網絡的架構圖,具體的細節看論文去。

整體上,這樣做都是為了學到更好的特征,而且是在weakly-supervised的限制下。 至于有沒有效果,就看你怎麼用了。

===== 如果這篇博文對你有幫助,可否賞筆者喝杯奶茶?

Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

繼續閱讀