CNN-第四周

2023-07-14 17:08:54

1. 人臉識别

Face recognition可分為：Verification, Recognition。

CNN-第四周

1.1 One Shot Learning

One shot learning所針對的情況是，在訓練集隻有一張目标對象的圖檔時，正确識别目标對象。

CNN-第四周

顯然基于我們之前的知識，在隻有目标對象的一個訓練樣本時，無法建構出一個有效的深度學習模型。是以我們相信建構一個能夠學習分辨兩個樣本相似度的模型。

Learning a “similarity” function

CNN-第四周

那麼如何去比較兩種圖檔的相似度呢？Siamese Network将告訴我們

1.2 Siamese Network

CNN-第四周

過程：将圖檔輸入CNN模型，利用最後某一層作為該圖檔的編碼代表，然後比較任意兩張圖檔在該層的差異。

CNN-第四周

下一步我們将告訴模型怎樣判斷兩張圖檔的差異大小。

1.3 Triplet Loss

在模型訓練時，每次我們都喂給模型三張圖檔，一張目标圖檔，一張陽性圖檔（同一個人），一張陰性圖檔（非同一個人）。然後讓調整參數，使得模型判别目标圖檔與陽性圖檔的相似高高于目标圖檔與陰性圖檔的相似度。

CNN-第四周

Loss function

在訓練集裡我們還是需要同一個人的多張照片。

CNN-第四周

Choosing the triplets A, P, N

然而如果是完全随機選擇的一張圖檔作為陰性樣本，則很容易達到A與P的相似度遠高于A與N，這樣模型的學習過程就會變得非常低效。是以我們需要在初始時，選擇那些很相近的三聯體（triplets）。

CNN-第四周

Training set using triplet loss

CNN-第四周

1.4 Face Verification and Binary Classification

Learning the similarity function

CNN-第四周

2. 風格遷移

Neural style transfer

CNN-第四周

2.1 What are deep ConvNets learning?

利用可視化圖像去觀察深度神經網絡模型所學到的特征。

從下圖可以發現，第一層的神經元大多在學習識别簡單的直線線條：

CNN-第四周

随後的深層神經元會逐漸學習更複雜的特征：

CNN-第四周

2.2 Cost Function

為了實作風格遷移，我們也要選擇一個損失函數。

CNN-第四周

Find the generated image G

首先随機初始化一張圖像G（像素随機分布），然後利用梯度下降算法降低損失函數

CNN-第四周

2.3 Content Cost Function

CNN-第四周

2.4 Style Cost Function

什麼是Style?

我們用卷積網絡的第L層神經元去度量“style”；style 被定義為不同channels的激活值的相關性(correlation)

CNN-第四周

Intuition about style of an image

correlation 訓示兩組特征同時出現的幾率。

CNN-第四周

Style matrix

CNN-第四周

（風格遷移的損失函數這塊确實有點跟不上了）

2.5 1D and 3D Generalizations

Convolutions in 2D and 1D

CNN-第四周

注：如無特殊說明，以上所有圖檔均截選自吳恩達在Coursera開設的神經網絡系列課程的講義。

CNN-第四周

1. 人臉識别

1.1 One Shot Learning

1.2 Siamese Network

1.3 Triplet Loss

1.4 Face Verification and Binary Classification

2. 風格遷移

2.1 What are deep ConvNets learning?

2.2 Cost Function

2.3 Content Cost Function

2.4 Style Cost Function

2.5 1D and 3D Generalizations

繼續閱讀

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡