天天看點

第四部分 人臉識别和神經風格轉換 - 2 筆記

4.5 面部驗證與二分類

Face verification and binary classification

第四部分 人臉識别和神經風格轉換 - 2 筆記

利用Triplet loss是訓練Siamese網絡非常有效的方法,當然還有其他的訓練方法。比如,将人臉識别問題看作是一個二分類問題。将兩幅影像輸入Siamese網絡,假設輸入為x(i)、x(j),那麼編碼輸出為f(x(i))、f(x(j)),将編碼輸入邏輯回歸單元,然後進行預測。如果兩幅影像是同一個人,那麼标簽y應為1,否則為0。 邏輯回歸單元的處理方法:

第四部分 人臉識别和神經風格轉換 - 2 筆記

上述公式中,針對兩幅影像128維的編碼,對每個次元內插補點的絕對值,增權重重w和偏置b,然後128維累加,最後在進行邏輯歸回。除了取內插補點絕對值之外,還有其他的處理方法,例如Χ平方相似度:

第四部分 人臉識别和神經風格轉換 - 2 筆記

系統性能提升技巧: 由于網絡在做邏輯回歸之前,需要得到圖像128維的編碼。那麼在網絡訓練好之後,可以對資料庫中所有的影像進行編碼并進行存儲,然後待檢測人員的圖像在輸入系統編碼後,隻需要跟以及存儲好的圖像編碼進行相似度計算即可。

4.6 什麼是神經風格轉換? What is neural style transfer?

第四部分 人臉識别和神經風格轉換 - 2 筆記

C為内容圖像,S為風格圖像,G為内容圖像經過風格轉換後的圖像。

4.7 深度卷積網絡在學什麼? What are deep ConvNets learning?

第四部分 人臉識别和神經風格轉換 - 2 筆記

以Alexnet為例,展示卷積神經網絡不同隐藏單元之間的計算結果。以layer1為例,由于使用了ReLu激活函數,那麼尋找能夠使得該層單元激活最大的圖檔或圖檔塊,即找到哪一張圖檔最大的激活了特定單元。

第四部分 人臉識别和神經風格轉換 - 2 筆記
第四部分 人臉識别和神經風格轉換 - 2 筆記

在layer1,隻能看到小部分的卷積神經(未經過pooling),如果要畫出來哪些激活了激活單元,隻有一小塊圖檔塊是有意義的,因為這就是特定單元所能看到的全部。圖中可以看到,layer1中,圖檔中的邊緣或線條、顔色陰影等圖檔塊得到激活。可以了解為,第一層的隐藏單元通常會找一些簡單的特征,比如說邊緣或者顔色陰影。

第四部分 人臉識别和神經風格轉換 - 2 筆記

第二層似乎檢測到更複雜的形狀和模式,比如有很多垂線的垂直圖案。

第四部分 人臉識别和神經風格轉換 - 2 筆記

第三層檢測到更複雜的模式,比如圓形、蜂窩狀或方形等有規律圖案、人類等。

第四部分 人臉識别和神經風格轉換 - 2 筆記

第四層檢測到的模式和特征更加複雜,例如狗類、鳥類的腳等。

第四部分 人臉識别和神經風格轉換 - 2 筆記

第五層檢測到更加複雜的事物,例如鍵盤類的物體、文本、花、狗類等。 簡而言之,一層的邊緣,第二層的質地,到深層的複雜物體。

4.8 代價函數 Cost function 訓練神經風格轉換系統,首先要定義代價函數。

第四部分 人臉識别和神經風格轉換 - 2 筆記

定義代價函數形式如下:

第四部分 人臉識别和神經風格轉換 - 2 筆記

其中,Jcontent是内容代價,用來度量内容圖像C與生成圖像G的内容有多相似。Jstyle是風格代價,用來衡量風格圖像S與生成圖像G風格的相似度。兩種之間的權重由超參α合β來描述。

第四部分 人臉識别和神經風格轉換 - 2 筆記

算法簡要流程:1、随機初始化生成圖像;2、構造代價函數,并利用GD方法最小化代價函數。最小化代價函數的過程就是生成圖像的過程。

繼續閱讀