天天看點

(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

4. Experiments

4.1. Datasets

在兩個常用資料集上評估了所提出方法的性能,即CASIA-B和 OUMVLP資料集。

CASIA-B. CASIA-B資料集是最大的跨視角步态資料庫。它包括124個受試者,每個受試者有10組視訊。10組視訊中,6組是正常行走(NM),2組是背着包行走(BG),2組是穿着外套行走(CL)。每組包含11個不同角度的步态序列(0°-180°,采樣間隔為18°)。是以,CASIA-B 中有 個步态序列。每個受試者的步态序列分為訓練集和測試集。在訓練階段,根據不同的訓練規模配置三種訓練設定:小規模訓練(ST)、中規模訓練(MT)和大規模訓練(LT)。對于這三種設定,分别選擇 24、62 和 74 名受試者作為訓練集,其餘 100、62 和 50 名受試者分别用于測試。來自訓練集的所有步态資料用于在訓練階段訓練所提出的模型。在測試階段,将序列NM#01-NM#04作為注冊集,而考慮序列NM#05-NM#06、BG#01-BG#02和CL#01-CL#02作為驗證集來評估性能。

OU-MVLP. OUMVLP 資料集是規模最大的步态識别資料庫之一,共包含 10,307 個受試者。每個受試者包含兩組視訊,Seq#00 和 Seq#01。每組視訊從 14 個角度捕獲:0°-90° 和 180°-270°,采樣間隔為 15°。采用的協定為:5,153名受試者作為訓練資料,5,154名受試者作為測試資料來評估所提出方法的性能。在測試階段,Seq#01中的序列作為注冊集,Seq#00中的序列作為驗證集進行評估。

4.2. Implementation Details

采用與GaitSet相同的預處理方法來獲得 CASIA-B 和 OUMVLP 資料集的步态輪廓。每幀的圖像都歸一化為 的大小。網絡參數如表1所示。三元組損失公式中的設定為 0.2。GeM公式中的被初始化為6.5。CASIA-B 資料集中的批大小參數和均設定為 8。由于OUMVLP資料集比CASIA-B大得多,是以批大小設定為。在訓練階段,輸入步态序列的長度設定為30。在測試階段,将整個步态序列放入所提出的模型中以提取步态特征。在 ST、MT 和 LT 的設定中,epoch數分别設定為 60K、80K 和 80K。所有的實驗都以 Adam 作為優化器。 CASIA-B 資料集的權重衰減設定為5e-4。對于ST的設定,學習率設定為1e-4。對于MT和LT的設定,學習率首先設定為1e-4,70K次疊代後重置為1e-5。對于 OUMVLP 資料集,epoch數設定為 210K。學習率首先設定為1e-4,在 150K 和 200K 疊代後分别重置為 1e-5 和 5e-6。特别的,因為OUMVLP的ID比CASIA資料集多100倍,是以将标簽平滑操作加入交叉熵損失中。對于 OUMVLP 資料集,權重衰減首先設定為 0,然後在200K後重置為 5e-4。

表 1. 所提出方法的網絡結構。
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

4.3. Comparison with State-of-the-Art Methods

Evaluation on CASIA-B. 在CASIA-B上,将所提出的方法與最新的步态識别方法進行比較,包括ViDP、CMCC、GaitSet、AE、MGAN、CNN-LB、CNN-3D、CNN-Ensemble、ACL和GaitPart。實驗結果如表2所示。可以觀察到,所提出的方法幾乎在所有角度都達到了最佳識别精度。通過考慮不同的條件(NM、BG 和 CL)和不同的資料集規模進一步詳細分析比較結果。

首先探索不同條件(NM、BG 和 CL)的影響。從表2可以觀察到,當外部環境發生變化時,準确率顯著下降。例如,在設定為LT的情況下,GaitPart 在 NM、BG 和 CL 三個條件下的識别準确率分别為 96.2%、91.5% 和 78.7%。對于所提出的方法,在這些條件下的識别準确率為 97.4%、94.5% 和 83.6%,分别比 GaitPart 高 1.2%、3.0% 和 4.9%。實驗結果表明,該方法在 BG 和 CL 條件下具有顯著優勢,表明該模型可以提取更魯棒的步态特征。即使在 ST 和 MT 設定中,也可以看到相似的識别結果,該方法也獲得了最佳性能。另一方面,可以從真實場景中的任意視角和條件收集人類步态。是以,可以着重研究在各種外部環境因素下步态識别的穩健性。基于表2,進一步計算三個條件的平均準确率。表3顯示了所提出的方法與最先進的步态識别方法的比較結果,包括GaitSet和GaitPart。可以觀察到,該方法的平均準确率為 91.8%,分别優于 GaitSet 和 GaitPart 7.6% 和 3.0%。

還讨論了不同資料集規模設定的比較結果。Chao等人提供了一個評估協定,在CASIA-B上,方法的性能在三個不同的尺度上進行評估,即ST、MT和LT。本文展示了這三種設定的完整實驗結果。實驗結果如表2所示。可以觀察到,在 NM 條件下,GaitSet對于三種設定的識别準确率分别為 79.5%、92.0% 和 95.0%。對于所提出的方法,相應的識别準确率分别為 86.0%、95.9% 和 97.4%,分别提高了 6.5%、3.9% 和 2.4%。具體來說,所提出的方法可以在小規模資料集的設定上取得較大的改進。

表 2. CASIA-B 在所有視角、不同設定和條件下的 Rank-1 準确度 (%),不包括相同視圖的情況。
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)
表 3. 在 NM、BG 和 CL 條件下與 GaitSet和 GaitPart的比較。
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

Evaluation on OUMVLP. 進一步評估了該方法在 OUMVLP 資料集上的性能。為了公平比較,采用與 GaitSet 和 GaitPart 方法相同的訓練和測試協定。10307 名受試者分為兩組,其中 5153 名受試者用于訓練,其餘受試者用于測試。在測試階段,Seq#00被視為probe,Seq#01被當作gallery。表4展示了本文的方法與幾種著名算法的比較結果,包括GEINet、GaitSet、GaitPart和GLN。可以看出,本文的方法在大多數情況下都能達到最好的識别性能。

表 4. OUMVLP 在 14 個probe視角下(不包括相同視角案例)的 Rank-1 準确度 (%)。
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

4.4. Ablation Study

在本文中,所提出的識别架構包括幾個關鍵子產品,例如局部時間聚合、全局和局部特征提取器和廣義均值池化層。是以,設計了不同的消融研究來分析每個關鍵子產品的貢獻。

Analysis of GLFE module. 與大多數僅提取全局或局部步态特征的步态識别方法不同,本文提出了一種新的全局和局部特征提取器來提取步态特征,其中包含更全面的步态資訊。GLFE 子產品由三個全局和局部卷積層組成,即GLconv層,每個層包括一個全局分支和一個局部分支。為了探索全局和局部分支的貢獻,設計了消融研究來探索不同分支的作用。所有實驗均在設定 LT 下進行。實驗結果如表5所示。可以觀察到,在 NM 條件下,使用全局或局部分支的準确率分别為 97.1% 和 96.2%,而同時使用兩個分支的準确率分别為 97.4%,分别提高了 0.3% 和 1.2%。同時,全局和局部卷積層也提高了 BG 和 CL 條件下的性能。與僅使用全局或局部特征相比,GLconv 提取的步态特征可以更好地表示步态資訊。此外,GLconv的局部分支可以産生不同的分區。為了探索 GLConv 層中的最佳分區,通過設定不同的分區來進一步設計消融研究。表5表明,分區的數量對準确性的影響很弱。例如,N=2、N=4、N=8的GLFE子產品在NM條件下的準确率分别為97.3%、97.4%、97.4%。在本方法中,最終選擇了N=8的GLFE子產品來實作模型。

表5. 在CASIA-B上GLFE子產品中不同組合的rank-1準确性(%)。"GLConvA-1 "和 "GLConvA-2 "是第一和第二個GLConvA子產品。
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

空間特征映射分析。 傳統的空間特征映射使用或來聚合空間資訊。然而,僅使用、或它們的權重和,不能自适應地實作映射。在本文中,引入 GeM 池化來實作空間特征映射。為了驗證 GeM 池化層的有效性,通過在 CASIA-B 資料集上實施具有不同空間特征映射政策的方法來設計比較實驗。所有實驗都是在LT設定下實作的。實驗結果如表6所示。可以觀察到,的精度在所有條件下均達到最高的平均精度。具體來說,和的平均準确率分别為 91.3% 和 91.8%,這​​

​意味着 GeM pooling 可以獲得更魯棒的特征表示​

​​。此外,在BG和CL設定的條件下,GeM池化的表現比所有對比的的池化方法更好。例如,在 BG 和 CL 設定上分别優于

表 6 不同空間特征映射的準确率(%)
(ICCV-2021)通過有效的全局-局部特征表示和局部時間聚合進行步态識别(三)

局部時間聚合分析。 為了保持更多的空間資訊,引入了局部時間聚合操作來代替傳統步态識别方法中使用的第一個空間池化層。為了分析 LTA 操作的貢獻,設計了具有不同下采樣政策的方法。實驗是在 CASIA-B 資料集上使用 LT 設定進行的。實驗結果如表7所示。可以觀察到使用兩個空間池化層的準确率是96.3%,而“LTA+SP”的準确率是97.4%,說明使用LTA操作比隻使用空間池化可以獲得更好的性能。此外,還通過用 LTA 操作替換空間池化來構模組化型。但是,此設定的準确性已大大降低。原因​

​可能是兩次 LTA 操作使更多的時間資訊丢失。​

​是以,采用“LTA+SP”模式作為本方法中的最終下采樣政策。

表 7. 不同下采樣組合的準确率(%)

5. Conclusion

繼續閱讀