
本文為 AI 研習社編譯的技術部落格,原标題 :
NeuroNuggets: CVPR 2018 in Review, Part III
作者 | Sergey Nikolenko、Aleksey Artamonov
翻譯 | 老趙 校對 | 醬番梨
整理 | 鳳梨妹
原文連結:
https://medium.com/neuromation-io-blog/neuronuggets-cvpr-2018-in-review-part-iii-82a5a3129caf
NeuroNuggets:CVPR 2018年回顧,第三部分
CVPR 2018(計算機視覺和模式識别)會議已經結束,但我們不能停止回顧其精彩的論文; 今天,我們學習第三部分。在第一部分中,我們簡要回顧了2018年CVPR中關于計算機視覺GAN的最有趣的論文; 在第二部分中,增加了人性化,并談到了人類的姿勢估計和跟蹤。 今天,我們轉向Neuromation中内部研究的主要焦點之一:合成資料。 像往常一樣,論文沒有特别的順序,我們的評論非常簡短,是以我們絕對建議完整閱讀論文。
合成資料:模仿學習
合成資料是指通過3D模組化和渲染(通常用于計算機視覺)或通過其他方式人工生成的資料,然後用于訓練機器學習模型。 合成資料在機器學習中是一個令人驚訝的主題,最令人驚訝的是它被忽略了多長時間。 有關合成資料的一些着作可以追溯到2000年代,但在2016年之前它基本上沒有引起任何興趣。 它所使用的唯一領域是訓練自動駕駛汽車,對模拟環境的需求和收集真實資料集的不可能性使其成為合成資料集的完美情況。
現在興趣正在迅速增長:我們現在擁有模拟室内環境的SUNCG資料集,用于駕駛和導航的室外環境,用于學習姿勢估計和跟蹤的合成人的SURREAL資料集,以及甚至最近應用GAN來生成和改進合成的資料(我們希望回到這一點并解釋它之後的工作原理)。 那麼讓我們看看CVPR 2018作者對合成資料的看法。 由于這是我們的主要關注點,是以我們将比通常更詳細地考慮合成資料的工作。
從GAN生成合成資料:特征空間中的增強和自适應
R. Volpi等人,無監督域适應的對抗特征增強
S. Sankaranarayanan等人,生成适應:對齊域使用生成性對抗網絡
有一個非常有趣和有前途的領域,即使用GAN生成合成資料集來訓練其他模型。 從表面上看,沒有多大意義:如果你有足夠的資料訓練GAN,為什麼不用它來訓練模型呢? 或者甚至更好,如果你有一個訓練有素的GAN,你為什麼不采取鑒别器并将它用于你的問題?
但是這個想法在自适應域設定中變得更加有趣。 假設你有一個大的源資料集和一個小的目标資料集,并且需要使用針對目标的源資料集訓練的模型,該模型可能完全沒有标記。 這裡,對抗域适應技術訓練兩個網絡,一個生成器和一個鑒别器,并用它來確定網絡不能在源資料集和目标資料集中的資料分布之間進行壓縮。 這個領域是在Ganin和Lempitsky的ICML2015論文中開始的,其中使用鑒别器來確定這些特征保持域不變:
以下是2017年對抗性判别領域适應論文中這一想法如何略微概括的示意圖:
在Volpi等人的CVPR 2018論文中,來自意大利和斯坦福的研究人員使對抗訓練不是在原始圖像上,而是在特征空間本身。 GAN對預訓練網絡提取的特征進行操作,這使得有可能實作更好的域不變性并最終提高域适應的品質。 以下是Volpi等人改編的整體教育訓練程式:
另一種方法是由Sankaranarayanan等人在馬裡蘭大學的研究人員在2018年的CVPR中提出的。 他們使用GAN來利用無監督資料,使源和目标分布在特征空間中彼此更接近。 基本上,該想法是使用鑒别器來控制從嵌入産生的圖像保持用于源分布的真實圖像,即使嵌入是從目标分布的樣本中擷取的。 以下是它的工作原理,作者再次報告了改進的域适應結果:
你應該如何标記? 标簽品質研究
A. Zlateski等,關于标簽品質對語義分割的重要性
合成資料的主要賣點之一始終是像素完美的标簽品質,你可以使用合成資料輕松實作。 合成場景總是帶有完美的分割 - 但它有多重要? 這項工作的作者研究了如何精确(或多麼粗略地)标記你的訓練集以從現代卷積體系結構中獲得良好的分割品質......當然,與合成場景相比,執行此研究的工具更好。
作者使用他們專門開發的Auto City資料集:
在他們的實驗中,作者表明,毫不奇怪,最終的分割品質确實與生産标簽所花費的時間量密切相關,但與每個單獨标簽的品質無關。 這表明,生産大量粗标簽(例如,使用衆包)比對每個标簽執行嚴格的品質控制更好。
你的桌面遊戲裡的足球
K.Rematas等人,桌面遊戲裡的足球
在Neuromation,我們喜歡足球(是的,俄羅斯世界杯花了我們很多工作時間),這項研究真的太酷了。 作者提出了一個系統,可以拍攝足球比賽的視訊流并将其轉換為移動的3D重建,可以投影到桌面上并使用增強現實裝置進行觀看。
系統提取玩家的邊界框,使用姿勢和深度估計模型分析人物圖形并産生非常精确的3D場景重建。 請注意,專門針對足球領域的模型教育訓練如何真正改善結果:
它還激勵我們的心,他們實際上訓練從FIFA遊戲中提取的合成資料。 而且結果非常酷。
還有更多......
感謝您的關注。 下次我們可以更詳細地了解一些關于合成資料和域适應的CVPR 2018論文。
Sergey Nikolenko
Chief Research Officer, Neuromation
Aleksey Artamonov
Senior Researcher, Neuromation
想要繼續檢視該篇文章相關連結和參考文獻?
長按連結點選打開或點選【CVPR 2018摘要:第三部分】:
http://ai.yanxishe.com/page/TextTranslation/1195
檢視 CVPR 2018摘要 系列更多文章,請點選:雷鋒網(公衆号:雷鋒網)雷鋒網雷鋒網
CVPR 2018摘要:第一部分
CVPR 2018摘要:第二部分
AI研習社每日更新精彩内容,觀看更多精彩内容:
使用 SKIL 和 YOLO 建構産品級目标檢測系統
如何極大效率地提高你訓練模型的速度?
良心推薦:一份 20 周學習計算機科學的經驗貼(附資源)
資料科學家應當了解的五個統計基本概念:統計特征、機率分布、降維、過采樣/欠采樣、貝葉斯統計