2019年深度學習的十大預測

2018年即将結束，現在是開始預測2019深度學習的時候了。以下是我之前對2017年和2018年的預測和回顧：

關于2017年

預測

和

回顧

。2017的預測涵蓋了硬體加速，卷積神經網絡（CNN）的主導地位，元學習，強化學習，對抗性學習，無監督學習，遷移學習，以及作為組成部分的深度學習(DL)，設計模式和超越理論的實驗。

關于2018年

與

。2018年的預測涵蓋了硬體初創公司，元學習取代SGD，生成模型，自我博弈，語義差距，可解釋性，海量資料研究，教學環境，會話認知和人工智能倫理。

通過回顧我的預測表明，我發現我太樂觀了，高估了技術發展的速度。總的來說，社群一直處于一種誇大的期望狀态。事後看來，是因為忽略了一般認知的潛在複雜性。我們現在必須降低期望，并專注于有希望的領域。這些有希望的領域将逐漸取得進展而不是“moon shots”(注：一個瘋狂的想法或者不大可能實作的項目)。

革命性進展應該分階段發生，我們今天遇到的是實作Interventional level的主要障礙。這并不意味着我們不能取得任何進展，而是在目前的成熟度水準中有許多懸而未決的成果，而這些成果已經準備好進行開發，DL在2019年的進展将主要圍繞這一務實的認識。

以下是我的預測，與前幾年一樣，它們可作為跟蹤DL進度的指南。

1. 深度學習硬體加速減緩

深度學習硬體加速已經減緩，

脈動陣列

在2017年給全世界帶來了巨大的加速增長。我們不能指望2019年計算能力的大幅提升，NVidia的圖靈核心隻比Volta核心快一點。谷歌的TPUv3系統現在采用

液冷

，與之前的産品相比，密度更高。我不認為2019年會有任何重大的架構改進，是以不要像往年那樣大幅增加。

但是，我們将看到GraphCore和Gyrfalcon的新架構規避了記憶體傳輸的功率成本并支援稀疏操作，但是需要更改深度學習格式來适應這些新架構，以及需要進行新的硬體研究，這個靈感來自

生物學的納米意向性

。

2. 無監督學習已經解決，但不是所預期的

無監督學習的思維方式都是錯誤的。LeCun的蛋糕理論是錯的，不同類型的學習關系應如下所示：

為什麼UL價值最低，難度最小？那是因為沒有目标，你可以做任何可能有效或無效的叢集。最終，它歸結為基于UL嵌入的更高層的性能。UL嵌入本質上是包含豐富的先驗資料，這些先驗如何被利用取決于具有目标的上遊過程。ELMO和BERT已經發現我們可以訓練用來預測（或生成）其資料的UL，這是上遊任務的良好基礎。UL基本上是監督學習，其标簽已存在于資料中。簡而言之，UL已經被解決了，但并沒有像大多數從業者所期望的那樣。如果網絡可以做出良好的預測或者可以生成原始資料的良好傳真，那麼這就是UL。

是以，每個人都認為解決UL将是一項重大進展，因為人們可以使用沒有人類标簽的資料。不幸的是，因為免費提供的東西很容易提取，它已經被解決了。我在2019年對UL的預測是，研究人員将接受這一新觀點，轉而關注更有價值的研究（即continual或interventional學習）。

3. 元學習僅适用于研究

我們對元學習的了解似乎與對無監督學習的了解一樣模糊。如今所實踐的元學習更像是遷移學習。實際上更進階的元學習可以建構和改進自己的模型的。元學習應該能夠建立外推和創造性的學習模型，但我們無法實作這一能力。

任何适用于多領域的學習方法在技術上都是元學習算法。例如，梯度下降、遺傳算法、自我博弈和進化都是元學習算法。元學習方法的目标是開發在許多領域中學習良好的算法。

目前很少存在已知的元學習算法，但是知道存在一種我們不了解的元學習算法，我們不了解人們使用的元學習算法。此外，元學習像無監督學習一樣是一個太普遍的問題，以緻無法了解如何以通用的方式解決，可能天下真的沒有免費的午餐。

我認為有些具體的方法（如生成模型，混合模型和課程訓練）将有更好的機會獲得更有價值的結果，這意味着我們發現的元學習算法僅對特定類型的學習任務有用。就像通過梯度下降學習隻為特定任務加速梯度下降一樣，元學習隻能改善它所見過的任務中的學習。簡而言之，元學習充其量是内插的，不能概括全部，也許不存在通用的元學習方法，而存在一套元學習方法，可以拼湊在一起來産生

有效的課程

總之，元學習仍将需要研究。

4. 在科學中的應用生成計算模型

我們将可以更好地控制生成模型。這裡有三類已被證明是有效的

生成模型

：變分自編碼器、GAN和基于流的生成模型。我希望看到GAN和Flow模型的快速發展以及VAE的進展。我還期望在科學探索中看到這種涉及複雜的自适應系統應用（即天氣、流體模拟、化學和生物學）。這方面的進步将對科學進步産生深遠的影響。

5. 混合模型在預測中的應用

深度學習在提供高維系統預測方面發揮出優勢。然而，深度學習仍然無法制定自己的抽象模型，這仍然是解釋性和外推預測的基本障礙。為了補充這些限制，我們将看到混合雙重過程解決方案，它将現有模型與無模型學習相結合。

我覺得使用hand-crafted的模型可以減輕無模型RL的低效率問題。我期待

關系圖網絡

的進展，并且當這些圖與先前的基于模型的模型有偏差時，我們會看到令人印象深刻的結果。我還期望通過融合現有的符号算法與DL，來提升預測能力。

DL的産業化将不是因為我們在遷移學習方面取得了進步，而是通過人工模型和DL訓練模型的融合。