目錄
基于進化算法和權值共享的神經網絡結構搜尋
檢測視訊中關注的視覺目标
包含狀态資訊的弱監督學習方法進行人物識别
基于解剖學感覺的視訊3D人體姿态估計
RandLA-Net:一種新型的大規模點雲語義分割架構
基于進化算法和權值共享的神經網絡結構搜尋
論文名稱:CARS: Continuous Evolution for Efficient Neural Architecture Search
作者:Zhaohui
發表時間:2020/3/4
論文連結:https://arxiv.org/pdf/1909.04977.pdf
推薦原因
本文為2020CVPR的文章,是國内華為公司的一篇paper。本文的主要工作是為了優化進化算法在神經網絡結構搜尋時候選網絡訓練過長的問題,作者參考了ENAS和NSGA-III。在此基礎上,作者提出了一種新的方法——連續進化結構搜尋(continuous evolution architecture search),簡記為CARS。該方法盡可能的利用學習到的一切知識,包括上一輪訓練的結構和參數。
創新點:
1、開發了一種有效的連續進化方法用于搜尋神經網絡。可以在訓練資料集上調整最新一代共享一個SuperNet中參數的總體架構。
2、使用None-dominated排序政策來選擇不同大小的優秀網絡,整體耗時僅需要0.5 GPU day。

檢測視訊中關注的視覺目标
論文名稱:Detecting Attended Visual Targets in Video
作者:Chong Eunji /Wang Yongxin /Ruiz Nataniel /Rehg James M.
發表時間:2020/3/5
論文連結:https://arxiv.org/abs/2003.02501v1
推薦原因
這篇論文被CVPR 2020接收,要解決的是檢測視訊中關注目标的問題。具體來說,目标是确定每個視訊幀中每個人的視線,并正确處理幀外(的情況。所提的新架構有效模拟了場景與頭部特征之間的動态互動,以推斷随時間變化的關注目标。同時這篇論文引入了一個新資料集VideoAttentionTarget,包含現實世界中複雜和動态的注視行為模式。在該資料集上進行的實驗表明,所提模型可以有效推斷視訊中的注意力。為進一步證明該方法的實用性,這篇論文将預測的注意力圖應用于兩個社交注視行為識别任務,并表明所得分類器明顯優于現有方法。
包含狀态資訊的弱監督學習方法進行人物識别
論文名稱:Weakly supervised discriminative feature learning with state information for person identification
作者:Yu Hong-Xing /Zheng Wei-Shi
發表時間:2020/2/27
論文連結:https://arxiv.org/abs/2002.11939
推薦原因
這篇論文提出使用狀态資訊的弱監督學習實作行人識别的方法。
在擷取人工标注的訓練資料代價太高的現實下,使用非監督學習來識别每個行人不同的視覺特征具有很重要的意義。但由于如攝像頭拍攝位置角度不同等狀态差異,同一個體的照片都會存在視覺差别,給無監督分類學習帶來了巨大困難。而本文就提出了能夠利用這些不需要人工标注的狀态資訊(如攝像頭位置或臉部拍攝角度标注)的弱監督學習方法,該方法使用狀态資訊優化了假定類别的決策邊界,以及使用狀态資訊調節控制了識别特征的偏移。論文在Duke-reID, MultiPIE 和CFP資料集上進行測試,結果遠優于其它現有方法,同時論文的模型和标準的有監督學習模型也進行了比較相較,并顯示出相當的性能。文章代碼可見https: //github.com/KovenYu/state-information.
基于解剖學感覺的視訊3D人體姿态估計
論文名稱:Anatomy-aware 3D Human Pose Estimationin Video
作者:Tianlang Chen
發表時間:2020/2/1
論文連結:http://arxiv.org/pdf/2002.10322.pdf
推薦原因
研究意義:
本文提出了一種新的視訊中3D人體姿态估計的解決方案。與傳統的研究進行對比,本文不是直接根據3D關節位置進行研究,而是從人體骨骼解剖的角度出發,将任務分解為骨骼方向預測和骨骼長度預測,從這兩個預測中完全可以得到三維關節位置。
創新點:
1、本文提出了一種具有長跳躍連接配接的全卷積傳播結構,用于骨骼方向的預測。該網絡結構可以實作在分層預測不同骨骼的方向時,而不使用任何耗時的存儲單元(例如LSTM)。
2、采用一種隐含的注意機制将2D關鍵點可見性分數作為額外的指導回報到模型中,這顯著地緩解了許多具有挑戰性的姿勢中的深度歧義。
RandLA-Net:一種新型的大規模點雲語義分割架構
論文名稱:RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds
作者:Qingyong Hu
發表時間:2020/2/1
論文連結:https://arxiv.org/pdf/1911.11236.pdf
推薦原因
本文的核心:
作者主要介紹了RandLA-Net網絡架構來推斷大規模點雲上的per-point semantics。之是以采用随機點采樣而不是更複雜點的選擇方法,是因為可以大大減少記憶體占用的架構計算成本。此外,作者還引入了一種新穎的局部特征聚合子產品,通過使用輕量級的網絡體系結構,最終證明了RandLA-Net網絡架構可以有效地用來解決大規模點雲問題。
創新點:
作者提出了一種基于簡單高效的随機将采樣和局部特征聚合的網絡結構(RandLA-Net)。該方法在資料集Semantic3D和SemanticKITTI等大場景點雲分割資料集上都取得了非常好的效果,進而驗證了該方法的優良性,此外通過實驗發現,采用本文提出的網絡架構,計算效率也是非常高的,明顯優于其它模型。