Relation Network for Person Re-identification

Paper：https://arxiv.org/abs/1911.09318v2

Code：https://github.com/cvlab-yonsei/projects/tree/master/RRID/code

摘要：Re-ID旨在從一組相機網陣中捕獲的圖像中檢索相關人員圖像的任務。最近的Re-ID方法表明，利用描述身體部位的局部特征，加上行人圖像本身的全局特征，即使在缺少身體部位的情況下，也能提供健壯的特征表示。然而，直接使用個體的局部特征，而不考慮身體各部分之間的關系，混淆了在相應部分具有相似屬性的不同ID。為了解決此問題，我們為行人Re-ID提出了新的關系網略，它考慮了身體各個部分與其他部分之間的關系。我們的模型可使一個單獨的部件級特征也包含身體其他部分的資訊，進而使它更具有識别力。我們還介紹了一種全局對比池化方法（GCP）來獲得行人圖像的全局特征。我們提出通過GCP使用對比特征補充傳統最大和平均池化方法。在三個公開資料集上展示了我們模型的有效性。

知識點解析：

a）：概述：得到一張行人圖像的特征圖（C*H*W）。将得到的特征圖水準分割成6網格。然後對每個特征圖應用GMP，得到size為1*1*C的局部層次的特征圖。我們将特征圖送進兩個子產品中，以提取新的局部和全局行人表示：One vs rest子產品和GCP。第一個子產品通過考慮身體各部分與其餘部分之間的關系，使得每個局部層次的特征更具有辨識力，并輸出1*1*c的局部關系特征。第二個子產品提供一個1*1*c的全局對比特征，表示行人圖像本身。我們沿着通道維将全局對比和局部關系特征連接配接起來，并使用1*1*7c的特征作為Re-ID的行人表示。我們使用交叉熵和三元損失來訓練我們的模型，其中三元組為anchor、positive和negative的行人圖像。在測試時，我們提取行人圖像的特征，并計算他們之間的歐式距離來确定行人的ID。

b）：Relation networks for part-based reID：1）：局部層次特征：我們利用在ImageNet預訓練的ResNet-50作為主幹網絡，從輸入的圖像中提取初始特征圖。具體來說，根據PCB的工作，我們将ResNet-50的GAP和全連接配接去掉，并将最後一個卷積層的stride設定為1。類似于其他基于局部特征的Re-ID方法，我們将初始特征圖分成C*H/6*W的水準網格，對每個網格應用GMP，得到1*1*C的局部水準特征。2）：One VS rest關系子產品：從水準網格中提取局部層次的特征，可以隐式地利用身體的各個部分來表示不同的人。現有的Re-ID方法将這些局部特征獨立地用于行人檢索。考慮到行人圖像之間的粗糙的幾何對應，他們以特定的順序将所有局部特征連結起來。雖然此結構化的行人特征可以對幾何變化和遮擋，但是他們沒有考慮身體部分之間的關系。也就是說，各個部分是孤立的，不與其他部分通信，這就分散了計算不同ID之間在相應部分中具有相似屬性的相似度。為了緩解這個問題，我們提出利用身體各部分之間的關系來表示行人。具體來說，我們引入一個新的關系網絡（圖2），它利用身體部分的one VS rest關系，使得每個局部層次的特征都可以包含相應部分本身和其他身體部分的資訊。具體來說，我們用