天天看點

谷歌開放自然語言了解軟體源代碼: 這項技術讓電腦了解自然語言

從今天開始,谷歌給外界軟體開發人員開放了自然語言算法, 并釋出幫助開發者建構基于語言的應用和服務的工具,助力開發比經常産生誤解聊天機器人更好的應用。

一個今天釋出的工具,叫做 SyntaxNet,在有語境和常用注釋的情況下,可以學會了解單詞和短語的意思。這個工具使用了原先由谷歌釋出叫 TensorFlow 的深學習架構。它是一個使用 TensorFlow 迄今建構的最複雜的部件。

谷歌還釋出了預先訓練的英語解析器,稱為 Parsey McParseface。輸入該英語解析器的文本将自動被分成句法組分如名詞,動詞,主題和對象。這使得計算機能容易地解析不明确的查詢或指令。

谷歌開放自然語言了解軟體源代碼: 這項技術讓電腦了解自然語言

谷歌通常依賴于資料和機器學習的方法,Facebook 就正在試圖培養計算機解析文法, 通過輸入大量未标注的資料(見“

教學機器了解我們

”)。但是,谷歌的語言了解項目,在網上的一篇論文中說,是基于專家的專業知識。八年多來,語言專家一直在努力為谷歌注釋文本。而最近的進展是把這些标注資料輸入大型深學習神經網絡的結果。

了解語言對于計算機非常困難的,因為語言通常是模糊的。搜尋簡單的 “Find me cats in hats”,可以解釋為戴帽子或貓坐在帽子。雖然人類使用一般知識來了解這樣的句子,谷歌的技術采用機器學習。其深度學習系統,經過文法文字的訓練,做出這句話的最有可能的正确結構的判斷。在 “Find me cats in hats” 這句話的情況下,這個算法假定搜尋者時尚前衛的貓科動物有興趣。

原文連結:

https://www.technologyreview.com/s/601440/googles-algorithms-decode-language-like-a-trained-linguist/

繼續閱讀