深度學習中，還有這15個未解難題

2018-01-08 23:50:00

本文來自AI新媒體量子位（QbitAI）

認臉、翻譯、合成語音……深度學習在很多問題上都取得了非常好的成績。

那麼，還有什麼問題不能用深度學習來解決呢？

斯坦福大學在讀博士Bharath Ramsundar列出了下面16個方面，希望能對今後的算法開發有所幫助。

量子位翻譯了這篇文章，以下為譯文。

1．衆所周知，深度學習方法很難學習到輸入樣本的微小變化。當樣本的顔色交換時，所建構的目辨別别系統可能會完全崩潰。

2．基于梯度的網絡訓練過程相當緩慢。一般按照固定模式來實作多種梯度下降方法，但是這種方法很難用于高維資料的預測。

3．深度學習方法在處理條件限制方面的效果也不佳，不能像線性規劃方法那樣，能快速找到滿足限制的解決方案。

4．在訓練複雜模型時，網絡相當不穩定。通常不能很好地訓練神經圖靈機和GAN網絡，嚴重依賴網絡的初始化方式。

5．深層網絡能較好地應用于圖像處理和自然語言分析中，但是不适合現實世界的實際問題，如提取因果結構等等。

6．在實際應用中，要考慮關鍵影響者檢測的問題。在參議員投票的資料集中，應該如何檢測出關鍵影響者，深度神經網絡DNN還不能應用于此方面。

7．強化學習（Reinforcement learning）方法對輸入資料非常挑剔，實際性能主要取決于調參技巧，雖然這個特殊問題僅存在于這個方面。

8．深度學習方法不容易了解未知實體，比如說當棒球擊球手在視訊中，深度學習不知道如何推斷出螢幕外還有個投手。

9．實時訓練深層網絡幾乎不可能，是以很難進行動态調整，上文已經提到網絡訓練緩慢的問題。

10．一般來說，網絡需通過離線訓練後才能進行智能辨識。

11．人們經常提出一些對深層網絡的理論解釋。但這可能不是一個大問題，人們才是一個真正的大問題。

12．目前很難确定深層網絡學習到了什麼。作為工程師的我們，怎樣才能確定在網絡訓練過程中不存在偏見和種族歧視？

13．深度神經網絡很難用來解決邏輯問題。3SAT求解器具有很強的能力，但是很難應用到深層網絡。

14．深度神經網絡在處理大次元的特征資料方面效果不佳。這種方法與強大的随機森林方法不同，在訓練前需要大量的特征調整。

15．深度網絡的超參數優化研究仍然處于起步階段。研究者需要完成大量的計算或是手動調整許多網絡結構。

以上這些并不是一個完整的清單，但是我覺得這些都是值得思考的問題。在這些問題的基礎上，要思考：

這些問題是深層神經網絡本身存在的問題，還是要被克服的工程挑戰？

這些都很難說，其中的一些問題可能會得到解決，比如更多性能優秀的硬體被開發用于超參數自動搜尋。有一些早期結構可以用來自動歸一化和處理大次元的特征資料，是以處理特征的問題可能有所改善。

然而，邏輯、限制、隐藏結構和網絡審查等問題可能會進行更深入地研究。我很願意看到大家對這些問題提出質疑，深度學習的研究者通常都是很有才華和有想象力的。摩爾定律仍然适用于GPU性能曲線，TPU和定制硬體還需要多久才能上市？

是以我對這些挑戰持樂觀态度。盡管如此，我還是懷疑深度神經網絡不足以實作通用人工智能，當然，這可能隻是我的偏見，事件上的專家可能是預測上的菜鳥，我們花了太多時間鑽研技術。

千萬不要隻知其然，而不知其是以然！

我不想把這個随筆寫成一篇文章，不确定是否有未知的主題還未被列出。

最後，作者還說，把這篇随筆送給聰明的讀者。

【完】

本文作者：王小新

原文釋出時間：2017-06-22

深度學習中，還有這15個未解難題

繼續閱讀

如果你想要學習深度學習，但是不知道從何入手，那麼《每天五分鐘深度學習》專欄一定是你不容錯過的學習資源。這個專欄包含了神經

tensorflow學習——keras進階API——序列模型Sequential

SVD原理和案例(奇異值分解)

連續兩年入圍全球Gartner ABI魔力象限，Quick BI在商業智能領域究竟有何魔力？1、互動式的分析和可視化2、建構資料故事3、釘釘內建4、增強分析Quick BI

技術解密｜阿裡雲多媒體 AI 團隊是憑借什麼拿下 CVPR2021 5冠1亞的？頂級挑戰賽戰績顯赫四大挑戰的關鍵技術探索基于視訊了解技術打造多媒體 AI 雲産品

算法專家解讀 | 開放搜尋教育搜題能力和實踐

Keras使用分批疊代（fit_generate）的方式訓練資料

圖像分割UNet系列------UNet3+（UNet3plus）詳解

圖像分割UNet系列------UNet詳解

特征：什麼是特征和特征選擇？

Pytorch(二) Tensor Tensor的建立Tensor是什麼Tensor的建立

2023了，學習深度學習架構哪個比較好？

VGGNet------超經典神經網絡結構與PyTorch實作

tensorflow學習——（imdb資料集）文本分類first_2.py

Matlab深度學習-手寫體數字識别Matlab深度學習前言一、MNIST手寫體數字資料二、用到的深度學習架構-LeNet5三、代碼最後

K-近鄰算法以及圖像分類應用