天天看點

一周AI最火論文 | 和機器人一起“雲”健身,VR健身房助力人機互動

本周關鍵詞:AutoML、強化學習、VR

本周最佳學術研究

用AutoML-Zero從零開始發展的機器學習算法

在最近的一篇論文中,為了鼓勵更多AutoML的研究,Google AI展示了從頭成功開發ML算法的可能性。

以前,AutoML的作用是,通過神經體系結構搜尋(NAS)技術,對不同需求自動生成并設計出相應的機器學習算法。

想使用NAS,需要專家來建構複雜的設計層來幫助建構神經網絡。但是,在研究員稱為AutoML-Zero的這種新方法中,Google AI展示了一種替代方法,可以自動發現以基本數學運算為基礎的完整ML算法。

在小圖像的分類問題上,該新方法重新發現了基本的機器學習技術,例如帶有反向傳播的2層神經網絡,線性回歸等。所獲得的結果證明了,使用算法自動發現機器學習算法是可行的,這對解決未來的難題可能很有借鑒意義。

原文:

https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html

深層次變分自編碼器

在本文中,NVIDIA研究人員提出了一種稱為Nouveau VAE的深度變分自動編碼器(VAE),該編碼器使用深度方向可分離的卷積以及批歸一化,來生成大型高品質圖像。

NVAE的設計着眼于解決兩個主要挑戰,首先是設計針對VAE的具有強表現力的神經網絡,第二則是在保持訓練穩定性的同時,擴充訓練到更多層,讓它适合更多不同的圖像尺寸。

這項工作表明,NVAE在MNIST,CIFAR-10和CelebA HQ資料集中基于非自回歸似然性的模型中,得到了最優的結果。NVAE也為FFHQ提供了強有力的基準線。例如,在CIFAR-10上,NVAE将最新技術從每維2.98位提高到了2.91位,并在CelebA HQ上生成了高品質圖像。據研究人員稱,NVAE是第一個成功應用于大尺寸256×256像素自然圖像的VAE。

https://arxiv.org/abs/2007.03898

有限資源深度學習的中高效的資料和計算設計

深度學習最近已越來越靠近邊緣裝置,這為創造需要實時分析資料的新應用程式,提供了可能。但是,深度神經網絡的計算量很大,需要大量的資料進行訓練以及複雜的體系結構,才能實作最新的性能。

本文中,為了實作更好的泛化和更高效的推理,研究人員試圖通過結合量化和等方差的方式來解決此問題。他們設計并測試了MobileNetV2的等變版本,并通過模型量化對其進行了進一步優化,實作了更高效的推理。結果顯示,這個設計對Patch Camelyon(PCam)醫療資料集具有最先進的性能,同時計算效率更高。

https://arxiv.org/abs/2004.09691v2

Duality — 強化學習新方法

谷歌AI研究人員開發了一種用于強化學習(RL)的新方法,可以實作既實用又符合數學原理的算法。這意味着所得到的算法可避免使用非常粗略的近似來實作其數學基礎原理。

基于凸對偶性所得到的方法是一種經過充分研究的數學工具,用于将以一種形式表示的問題轉換為其他形式的等效問題,進而可能更利于計算。谷歌AI研究人員所開發的在強化學習(RL)中應用對偶性的特定方法,将傳統的限制滿足式數學問題轉換為無限制且更實際的數學問題。

他們希望強化學習和(凸)優化之間的聯系可以促進這兩個領域研究人員之間的進一步合作。

https://ai.googleblog.com/2020/07/duality-new-approach-to-reinforcement.html

利用真人互動改進虛拟輔助機器人

在這個項目中,研究人員提出了輔助虛拟現實健身房(AVR Gym),這是一個開源架構,用于真人與虛拟輔助機器人的互動。

研究人員認為,多功能的機器人護工可以使全球數百萬人(包括老年人和殘障人士)受益。

由于對如何使機器人護工通過實體模拟學習與人互動的研究仍然是一個巨大的挑戰,是以他們提出的方法可能還需要很長時間才能實作。

研究人員提供的證據表明,AVR Gym可以幫助他們提高受過模拟訓練的輔助機器人的性能。其成果顯示,VR可以通過讓真人與虛拟機器人進行互動,幫助縮小實體模拟與現實之間的差距,進而為實作真正的機器人輔助鋪平道路。

https://arxiv.org/abs/2007.04959v1

其他爆款論文

人臉3D重建新方法 - 用單色圖像即可生成高品質的重建圖像,且可以适應自遮擋和大範圍姿勢變形:

https://arxiv.org/abs/2007.03979v1

基于神經架構搜尋的新型目标檢測架構:

https://ai.googleblog.com/2020/06/spinenet-novel-architecture-for-object.html

利用圖卷積神經網絡優勢,打造一種有效的基于圖表的視觸覺融合式3D重建方法:

https://arxiv.org/abs/2007.03778v1

Pix2Vox++:一種在準确性和效率上均優于傳統方法的新型3D對象重建方法:

https://arxiv.org/abs/2006.12250v2

改進GAN實作語音增強:

https://arxiv.org/abs/2001.05532v2

資源

一個涵蓋機器學習論文及代碼實作的免費分享社群:

https://paperswithcode.com/methods

Pytorch官方教程免費書籍下載下傳:

https://pytorch.org/deep-learning-with-pytorch

Gradio:僅需幾行代碼,即可為機器學習模型甚至Python函數生成易用的web界面:

https://gradio.app/

AI大事件

福布斯AI 50排行榜多家公司創始人預測後新冠疫情時代的AI發展空間:

https://www.forbes.com/sites/kenrickcai/2020/07/10/ai-50-founders-post-coronavirus-predictions/#17c8ce6d2ccc

亞馬遜官宣将在未來幾個月内開始使用無人機運送包裹:

https://www.zdnet.com/article/amazon-unveils-drone-that-will-be-delivering-packages-in-months/

大衆創新為AI肺癌篩查提速:

https://www.zdnet.com/article/researchers-find-crowdsourcing-ai-go-together-in-battle-vs-lung-cancer/