還記得擊敗世界圍棋大師的阿爾法狗 alphago 嗎?
它來自谷歌 deepmind 團隊,現在這個人工智能實驗室又推出了一項重磅研究——可微分神經計算機的神經網絡模型(differentiable neural computer,簡稱 dnc)。這種新型模型将神經網絡與可讀寫的外部存儲器結合,既能像神經網絡那樣通過試錯和樣本訓練進行深度學習,又能像傳統計算機一樣處理資料。
深度學習作為一種神經網絡人工智能算法,能夠通過一些“深”層計算,對海量的資料進行更新學習。這種類似大腦結構的神經網絡層由節點組成(也被稱為神經元)。許多科技巨頭如谷歌、facebook、亞馬遜和微軟都一直在訓練神經網絡來學習如何更好地處理工作任務,包括識别狗的圖像以及做出更好的翻譯軟體。這些 ai 功能已經讓數百萬人在使用谷歌翻譯等線上服務中受益。
但是,神經網絡面臨着巨大的挑戰:正常計算機可以處理複雜形式的資料,但是需要手動程式設計來執行這些任務。雖然人工神經網絡可以像大腦一樣進行學習,從資料中識别模式,但是它缺少存儲器架構,無法對結構化資料進行符号處理。
dnc 簡易模型,圖源:ft
為了提高深度學習的能力,谷歌的 deepmind 團隊創造了這種新型機器學習算法“ 可微分神經計算機”dnc,它将“神經網絡”計算系統與傳統計算機存儲器結合在一起。
神經網絡是一個互聯的系統,它模仿生物神經網絡運作,比如大腦的工作模式。在最近取得的各項人工智能成就中,神經網絡扮演了關鍵角色。例如,在數字助手,如 google voice、siri 中增強語音識别能力。在之前的研究中,神經網絡隻能連接配接自有網絡所包含的資料。而最近,deepmind 團隊宣布,在 dnc 的支援下,神經網絡可以接入之前不相容的外部資料,比如以傳統數字模式編碼的文本。這也就是說,我們離會思考的計算機更近了一步。
從數學上講,dnc 類似一個可微分的函數,這或許是研究人員稱它為可微分的原因。而數字計算機不可微分,是以也無法做到像神經網絡一樣從資料中學習。dnc 可以成功地了解圖形結構,如家譜或傳輸網絡,它甚至可以根據一張家譜來判斷一個人的家族關系。此外,dnc 還能在沒有先驗知識的情況下規劃在倫敦地鐵上的最佳路線,解決涉及用符号語言描述目标的移動拼圖謎題。
美國hbo連續劇《西部世界》劇照
推理是靈長類動物才具備的能力,deepmind 這種或許能夠“喚醒”機器的人工智能算法與最近大火的神劇《西部世界》中的設想一緻——也許有一天,我們真的能看到會自主推理的機器人,以及能思考的計算機。
dnc 包含了若幹個子產品,所有的這些子產品都完全不是符号化的,彼此之間通過純粹的模拟激活模型來交換資訊流(streams),正如從生物大腦中記錄的那樣。
推理的一個關鍵前提,是記憶。在計算機中,記憶的角色由随機通路記憶體 ram 承擔。當計算機進行推理,也就是運作程式時,所有的資訊都被捆綁在工作的記憶體中,并且結合的方式數不勝數。把人類的推理過程拿來與計算機程式相比,其實并不牽強。事實上,在現代可程式設計計算機(圖靈機)和亞裡士多德的三段論存在嚴肅的曆史聯系。
dnc 項目主管 alex graves 表示,“神經網絡的記憶受到計算本身的限制,我們決定通過分離存儲器的方式讓它變得更強大,這樣一來,不影響處理器就可以擴充規模。”
一些獨立計算機科學家認為通用 dnc 應用範圍廣闊,例如,它可以用來生成視訊注釋,從文本中提取有意義的内容。甚至在未來,它還能夠應用在包含問答、像真實世界一樣的對話,這種需要一定的推理能力任務。
這個新項目被 google 發表在《自然》雜志上。在文章裡 google 舉了若幹個應用執行個體,比如,內建後的深度學習技術能夠自動發現兩個地鐵站之間最短的路線,它會自己進行“推理”,說出你想要到達的目的地。正确率高達 90% 以上。
英國《金融時報》援引斯坦福大學心智、大腦和計算中心主任 jay mcclelland 稱,這項研究将成為人工智能領域“有趣且重要的裡程碑”。
推薦閱讀:
<a href="http://www.leiphone.com/news/201609/8tijfoz7urpubhpc.html">淺談神經網絡訓練方法,deepmind更青睐正向傳播</a>
<a href="http://www.leiphone.com/news/201609/erwga8fs7yr1zn2l.html">deepmind釋出最新原始音頻波形深度生成模型wavenet,将為tts帶來無數可能</a>
本文作者:劉子榆