天天看點

華人問鼎CVPR!最佳論文、最佳學生論文一作均為華人,近四成作者來自中國,清華為最高産機構

史上最難的的CVPR2020終于來了!

由于疫情影響,今年原定于6.14開始的線下讨論會改成位于西雅圖的線上會議。

在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。

CVPR(Conference on Computer Vision and Pattern Recognition)作為全球頂級計算機會議之一,會議形式分為論文讨論會和短期課程,其目的是憑借極具成本效益的研究,大力推動全球的計算機視覺行業的發展與進步。

根據本次Accept list接收情況來看,本次共接收文章1470篇(有效送出總數為5865篇),接受率為22%,比2018年的29.6%和2019年的25%都有下降,堪稱CVPR史上最嚴的收稿會。

由于疫情,本次會議需要線上舉行,項目主席Ce Liu很期待參會注冊人數能有較大增長,今年的注冊者,已經超過2018年參會注冊人數。

華人作者比例高達39.2%,清華大學為最高産機構

由于疫情原因,轉戰線上的CVPR參會注冊人數與前幾年相比有一定程度的上升,但即使如此,與去年的9200人相比仍有小幅下降。

大會開場公布的資料,今年參與CVPR論文的作者數量高達16955位,其中中國作者比例達 39.2%,位居第一。

在中國作者的所屬機構排名中,清華以340名位列第一,前10個機構中國高校占據了7席,包括上海交通大學、北京大學、浙江大學、中科大、北航、西安電子科技大學。

在接收主題方面,根據大會統計,視覺領域依然是目前最熱門的主題,遷移/low-shot/半監督/無監督學習緊随其後,圖像與視訊合成、3D等也持續火熱。

最佳論文

今年的最佳論文來自牛津大學,論文名為Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild。

在論文中,研究人員提出了一種無需外部監督即可從原始單視圖圖像中學習3D變形對象類别的方法。該方法基于自動編碼器,能夠将每個輸入圖像分解為深度,反照率,視點和照明。

為了在不進行監督的情況下解開這些元件,研究人員利用了許多對象類别在原則上具有的對稱結構,進而證明,通過照明推理幫助利用物體對稱性,即使由于陰影而觀看存在不對稱也無礙。

除此之外,研究人員還通過預測對稱機率圖來模組化可能對稱的物體,與模型的其他元件進行端到端學習。

實驗結果表明,這種方法可以非常準确地恢複人臉的3D形狀,單視場圖像中的貓臉和汽車,無需任何監督或事先的造型模型。在基準測試中,與另一種在2D圖像對應級别上使用監督的方法相比,我們證明了更高的準确性。

論文連結:

https://arxiv.org/abs/1911.11130

代碼位址:

https://github.com/elliottwu/unsup3d

demo位址:

http://www.robots.ox.ac.uk/~vgg/blog/unsupervised-learning-of-probably-symmetric-deformable-3d-objects-from-images-in-the-wild.html

本年度的最佳論文一作是來自香港科技大學2014級的大學生吳尚哲,2018年大學畢業後,吳尚哲選擇進入了牛津大學視覺幾何組,師從歐洲計算機科學家第一人Andrew Zisserman及弟子Andrea Vedaldi,深耕計算機視覺領域,主要研究方向是圖像轉換與生成,目前就讀博士二年級。

最佳學生論文

今年的最佳學生論文獎是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》,作者為來自西蒙弗雷澤大學和谷歌研究院的三位研究者。

https://arxiv.org/pdf/1911.06971.pdf https://github.com/czq142857/BSP-NET-original

這篇論文介紹了多邊形網格在深度學習特别是3D形狀生成中的運用。多邊形網格在數字3D領域無處不在,但在深度學習革命中,扮演了次要角色。學習形狀生成模型的主要方法依賴于隐函數,并且僅在昂貴的等值曲面處理例程之後才生成網格。

為了克服這些挑戰,我們受到了計算機圖形學Binary的經典空間資料結構的啟發空間分區(BSP),以促進3D學習。

BSP的核心成分是對空間進行遞歸細分以獲得凸集。通過利用此屬性,我們設計了BSP-Net,該網絡可通過凸分解學習表示3D形狀。重要的是,BSPNet無需監督,因為訓練過程中沒有凸形分解。BSPNet訓練網絡使用從在一組平面上建立的BSPtree獲得的一組凸面來重構形狀。

通過BSPNet訓練的凸面可以輕松提取以形成多邊形網格,而無需進行等值曲面處理。生成的網格是緊湊的(即低聚多邊形),非常适合代表尖銳的幾何凸顯;此外,生成的是水密網絡,易于參數化。論文結果還顯示,BSP-Net的重構品質與最新技術相比具有競争力,同時使用的原語更少。

這篇論文的一作是華人研究員Zhiqin Chen,大學畢業于上海交通大學,現為西蒙弗雷澤大學博士一年級在讀學生。

他的github首頁👇

https://czq142857.github.io/

最佳學生論文榮譽提名獎

本次獲得最佳學生論文榮譽提名獎的是德國馬普所和Facebook Reality Labs合作的論文:DeepCap: Monocular Human Performance Capture Using Weak Supervision。

在論文中,研究人員提出一種新穎的單目密集人體表現捕捉深度學習方法。該方法采用一種基于多視圖監督的弱監督方法進行訓練,完全不需要利用3D ground truth标注來訓練資料。

此外,網絡架構基于的兩個獨立網絡将任務分解為姿态估計和非剛性表面變形步驟,大量的定性和定量評估表明,研究者提出的方法在品質和魯棒性兩方面優于目前SOTA方法。

該方法的流程圖如下所示。首先,通過将稀疏多視圖2D關節檢測作為弱監督,研究者訓練姿态網絡PoseNet預測關節角度和相機相對旋轉,其次,研究者訓練變形網絡 efNet 傳回嵌入圖旋轉和平移參數,進而考慮到非剛性變形。此

了訓練變形網絡 DefNet,研究者将多視圖 2D 關節檢測和剪影用于監督。

https://arxiv.org/pdf/2003.08325.pdf

本次獲得最佳學生論文榮譽提名獎的論文一作為馬普所的Marc Habermann,他的主要研究方向為計算機視覺與計算機圖形學、動作捕捉、從RGB視訊重建非剛性變形、基于紋理的描述。

他的個人首頁:

https://people.mpi-inf.mpg.de/~mhaberma/

PAMI青年研究者獎的兩位獲得者是Jon Barron 和 D華人研究員qing Sun。

Jon Barron在2007年畢業于多倫多大學,又在2013年拿到加州大學伯克利分校的計算機科學博士學位,現在是一名谷歌的研究員。

Deqing Sun大學畢業于哈爾濱工業大學電子與資訊工程專業,2007年在香港中文大學獲得碩士學位,2013年在美國布朗大學拿到了計算機科學博士學位,現為谷歌進階研究員。

他在十年前發表的關于光溜原理的文章也被今年的CVPR評為了經典論文。

今年的經典論文獎(Longuet-Higgins 獎)的獲獎論文是 由Dqing Sun、Stefan Roth 和 Michael J. Black 三位在 CPR 2010 發的《一篇有關光流原理的文章:Secrets of Optical Flow Estimation and Their Principles》。

為了紀念今年過世的華人計算機視覺宗師Tomas S. Huang(黃煦濤)教授,PAMITC 今年準許設立 Tomas S. Huang 紀念獎,從 2021 年開始頒發。

黃煦濤先生生前是中國工程院和中國科學院“兩院”外籍院士,美國國家工程院院士,電氣電子工程師學會(IEEE)、美國光學學會、國際模式識别學會、國際光學學會(SPIE)等學會成員,

在學術界,翁巨揚和吳郢可以稱得上是黃煦濤先生的兩位得意門生。翁巨揚是黃煦濤在國内最早招收的博士生之一,曾在1992年Cresceptron項目中提出的“資料增強”和“最大化池”被廣泛應用至今,也促進了CNN的演化。吳郢從華中科技大學畢業後,來到UIUC在黃煦濤的指導下攻讀博士學位,随後在西北大學任教,培養出了包括前微軟亞洲研究院首席研究員華剛在内的多名學生。

在産業界,黃煦濤先生門下弟子也各路開花,包括華為諾亞方舟計算機視覺首席科學家田奇、聯想集團CTO芮勇、文遠知行CEO韓旭、原360集團首席科學家、依圖科技首席技術官顔水成、雲從科技創始人周曦等。黃煦濤先生在華人計算機視覺領域的影響力可見一斑。

今年還有哪些明星論文?

Github上的的CVPR 2020開源代碼和論文合集,已經放出已目前已有950顆星,根據論文分成52個分類,有興趣的同學可以看看。

直達連結:

https://github.com/amusi/CVPR2020-Code

還有一些比較有趣的論文研究,比如Facebook AI研究,來自Georgia Gkioxari等人的超越2D圖像的視覺識别。

輸入2D,輸出動态3D模組化。不僅展現在物品上,還展現在人物上。

詳細研究請見:

https://ai.facebook.com/blog/facebook-research-at-cvpr-2020

來自微軟研究院的,老照片修複技術,如果能上線使用的話,絕對是膠片達人的福音。

http://openaccess.thecvf.com/content_CVPR_2020/papers/Wan_Bringing_Old_Photos_Back_to_Life_CVPR_2020_paper.pdf

蘋果公司的神經網絡的最小二乘法優化算法,經過在ImageNet上實驗,結果證明使用最小二乘量化法的精度差距确實減小了。

https://arxiv.org/abs/2001.02786

繼續閱讀