雷鋒網AI科技評論按:蘋果第一篇AI論文一經投放,便斬獲CVPR 2017最佳論文。随後便有外界不斷猜測蘋果的論文品質有水分,似乎不能比對最佳論文的頭銜。雷鋒網記者随後從學術角度采訪了幾位學術界人士。看看他們怎麼說。
蘋果的AI研究消息首次進入公衆視野的是在去年的12月初。
2016年12月8日,在西班牙NIPS 2016大會上,蘋果AI研究負責人Russ Salakhutdinov承諾将會公布和分享他們的最新AI研究成果。
2016年12月22日,首篇機器學習論文通過康奈爾大學圖書館出版,顯示的送出時間是11月15日。
2017年7月19日,蘋果開通機器學習部落格(Apple
Machine Learning Journal ),同時發表一篇題為“Improving the Realism of Synthetic
Images”的文章。這篇文章用更通俗的語言介紹了之前發表的論文。
2017年7月22日,蘋果的這篇論文獲CVPR 2017最佳論文。
回顧一下這篇論文的主要内容:
這篇題為《通過對抗訓練從模拟的和無監督的圖像中學習》是圖像識别領域的論文。論文中,提出了一個“模拟+無監督學習”(simulated
+ unsupervised learning)的學習方法,使用的是如今非常火的深度學習“對抗訓練”。GANs(對抗訓練)發明者Ian
Goodfellow得知蘋果的第一篇機器學習論文是關于GANs,也十分興奮,并在自己的推特中第一時間轉了這篇論文。
GANs模型,簡單的說就是讓兩個網絡互相競争,玩一個“貓鼠遊戲”。
一個叫做生成器網絡G( Generator Network),它不斷捕捉訓練庫裡真實圖檔的機率分布,将輸入的随機向量轉變成新的樣本。一句話,G負責生成假圖檔。
另一個叫做判别器網絡D(Discriminator Network),它可以同時觀察真實和假造的資料,判斷這個圖檔到底是不是真的。
G嘗試用自己的生成的仿品來“蒙騙”D,而D也不斷提高自己鑒别真僞的水準。這樣G的造假能力和D的鑒别能力都會越來越高超。
而蘋果的“對抗訓練”是對原有的GANs模型做了稍加的修改,形成了自己的SimGANs模型。其中sim是單詞 Simulator的縮寫,即模拟器的意思。
蘋果的SimGANs其實包括三部分:模拟器(Simulator)和精制器(Refiner),然後再加上一個判别器(Discriminator)。模拟器合成圖像,再用精制器做優化使得更像真實圖檔,最後再由判别器做識别訓練。
蘋果也在自己的論文摘要中提到: “我們的模拟+無監督學習方法,使用的對抗網絡跟GANs很類似。但是,輸入值是合成圖像,而不是随機向量。
随後便有學術界人士質疑,指出蘋果的創新并不是具有突破性的,似乎不夠資格評選為“最佳論文”。
甚至在知名問答社群知乎上有人從論文的第一作者背景開始懷疑,最佳論文評選過程有暗箱操作的嫌疑。

點贊數最多的答主回答:
論文第一作者Ashish Shrivastava,馬裡蘭大學計算機視覺博士
随後雷鋒網駐國外記者也就「今年的CVPR 最佳論文是否實至名歸」這個問題采訪了幾位學術界人士:
CrowdAI 研究員Jigar Doshi接受采訪說:
(因為總共有兩篇最佳論文,他先從第一篇談起)第一篇Densely Connected Convolutional Networks(密集連接配接的卷積網絡)中,DenseNet模型有兩大貢獻,一個是計算效率提升,大幅度地減少了參數數量,模型訓練出來的精确度和品質都要比之前好。還有就是模型能夠泛化,研究者用了好幾個資料集,用來展示研究成果可以用到其他資料集和場景中。這是一個大家都能用,一個通用的方法。大家都在看,都在讨論,這篇論文是值得評為最佳論文的。 談到蘋果的SimGANs,Jigar評論到:SimGANs的優點是無需标注自動生成新資料,但是他在示範過程中隻用了一個資料集,對它的泛化能力表示存疑。半年前自己也試過類似的方法,不過不起作用,不了解為什麼在蘋果的試驗中起了作用。同時很奇怪為什麼這篇論文能評為最佳論文。
南洋理工大學一位研究手勢識别的計算機視覺博士評價蘋果論文說道:
蘋果SimGANs的手勢識别效果并不好,還沒有自己做的模型效果好。
另一位MIT生物圖像博士:
感覺SimGANs并不是很有意義(not very meaningful),相比其他方法并沒有很大的提升。
不過也有AI學界人士支援蘋果獲最佳論文,一位亞馬遜研究員告訴記者:
SimGANs 很簡單。但也開了一個新口子,針對一個具體問題有了新方法,未來其他人可以研究如何把類似方法用到其他領域,算是“抛磚引玉”。另外,由于該方法的特殊性,需要做許多工作才能用于某一領域,是以确實難以在一個研究中提出一個通用方案,解決一個具體問題已經可以了。
來自國内的一位中科院教授說道:
SimGANs 論文第一作者 Ashish Shrivastava 的導師是 CVPR 大會主席 Rama Chellappa,算是“舉賢不避親”(意思是隻要是真正有本領的賢能人才,不管與舉薦人是否有關系,都可以正常舉薦,讓賢能的人才發揮其作用。)雷鋒網(公衆号:雷鋒網)記者也跟其他參會的學生老師提了這個疑問,很多人認為論文評審流程嚴格,未必有多大不公平。
最後采訪的幾位大牛總結了一下今年的兩篇最佳論文:這兩篇論文沒什麼理論突破,隻是技術上的提升改進。同時也表示,今年的CVPR創新突破已經很少,差不多都是在原有的基礎上有一點點提升。
雷鋒網小結:三位反對蘋果獲最佳論文的統一看法是:蘋果SimGANs的泛化能力差,隻能用到具體的某個領域。另外單從表現效果上看,和其他方法相比也沒有很大的提升。兩位支援者看法是:由于SimGANs方法的特殊性,确實難以形成一個通用方案,不過蘋果給出了一個新思路,能啟發大家就夠了。這屆CVPR總體來說沒有學術界期待的那種劃時代的研究成果出現,蘋果論文之是以不那麼出色也能從中脫穎而出,恐怕不是蘋果“有關系”,而是“矮子裡面選高個”的原因吧!
雷鋒網
本文作者:楊文