天天看點

這幾天 AI 圈都在關注的深度學習庫評測

這幾天 AI 圈都在關注的深度學習庫評測

2016 年是雷鋒網(公衆号:雷鋒網)

ai

科技評論非常重要的一年,我們圍繞人工智能做了一系列的業界、學界、開發者報道,也請了一系列導師大牛過來給我們做技術解讀的公開課,在給這些導師大牛提供了一個絕佳展示舞台的同時,也給讀者們帶來了最深度的公開課内容,下面是雷鋒網

ai 科技評論年度盤點之語義識别篇。

<a href="http://www.leiphone.com/news/201608/gvjbkpxpgf2csxxo.html">深入 nlp———看中文分詞如何影響你的生活點滴</a>

嘉賓介紹:徐博士,約翰霍普金斯大學語言和語音實驗室博士。2012年畢業後加入微軟總部,先後在bing和微軟研究院從事自然語言處理和機器學習相關的研究和産品開發,是cortana語義了解和對話系統團隊以及wordflow輸入法團隊的主要成員。

中文分詞是中文自然語言處理的一個非常重要的組成部分,在學界和工業界都有比較長時間的研究曆史,也有一些比較成熟的解決方案。今天我們邀請了出門問問的兩位重磅嘉賓徐博士和jason,和大家一起來回顧一下中文分詞的發展,着重談一談現在比較流行的一些基于機器學習的分詞方法。内容主要包含以下幾部分:

什麼是分詞,為什麼要做分詞;分詞有哪些常見的傳統方法;機器學習在分詞領域有哪些應用;深度學習在分詞中的應用;除了深度學習之外,分詞領域還有那些新的發展方向;中文分詞在語義分析中的應用;在實際的應用中遇的一些困難。

中文分詞是nlp難題中的一道必然工序,最近因為深度學習的到來,很多人開始希冀這個新的機器學習算法可以為它帶來一些全新的東西。本文出門問問的兩個資深研究人員從什麼是中文分詞、中文分詞的傳統方法、中文分詞結合深度學習以及中文分詞在語義分析中的應用,在他們産品實際應用中遇到的問題,為我們由淺入深、從理論到應用做了一堂生動地科普,向我們展示了中文分詞和商業産品真正結合時的美妙碰撞。

<a href="http://www.leiphone.com/news/201609/j61tzoearji4ixeq.html" target="_blank">human-like learning在對話機器人中的魔性運用</a>

嘉賓介紹:戴帥湘,前百度主任架構師,曾長期擔任百度query了解方向負責人,是自然語言了解方面的技術專家,曾榮獲第一個也是迄今為止唯一一個以nlp技術為核心的百度最高獎。2010年提出“query改寫模型”給百度搜尋引擎技術帶來了跨時代的飛躍,使得搜尋相關性和廣告收入均大幅提升。

對話機器人很多,像siri,小冰,度秘,allo都能在你有空的時候跟你貧貧嘴,不過随着廠家和使用者意識到憑空做出一個高度通用的對話機器人是非常不現實的,對話機器人的姿态也發生細微的變化——廠家們試圖從某些垂直領域開始入手深根,并且從純聊天功能發展到這個對話機器人能為使用者完成什麼指定的任務功能。一下子為“隻說不做”

的對話機器人找到了一個新的場景。

不過,這個全新更新的對話機器人,重心移向代替人決策,并幫使用者完成任務。

它如何聽懂使用者想做什麼事情?如何做到聊天過程中都不能達到的human  like leaering?

然後它如何知道第三方app能完成哪些任務,需要點選哪裡,然後才能與使用者想做的事情對接?

當它的重心變成了為使用者完成任務時,它的核心技術要求是什麼?

<a href="http://www.leiphone.com/news/201606/n5lfkj3szxs1ytcd.html" target="_blank">地圖中的語義了解</a>

嘉賓介紹:王硯峰,搜狗公司桌面事業部進階總監,桌面研究部和語音互動技術中心負責人。承擔輸入法、号碼通、個性化新聞等搜狗桌面産品在大資料和算法研究方面的工作,同時負責搜狗智能語音互動技術,帶領語音和語義技術團隊實作了業内頂尖的語音互動能力,并緻力于智能語音技術的産品化創新。

在雷鋒網公開課中王硯峰指出:語義了解技術至少有兩個關鍵的因素:第一是自然語言處理技術,利用統計自然語言處理算法提取文本中的實體詞以及依存關系;第二是要有全面而豐富的知識庫,配合自然語言處理技術,才能得到使用者的準确意圖。

本期公開課的要點如下:

“結合上下文的‘多對話解析’”是如何做到的?其中的難點是什麼?

語義了解的準确率,整個行業目前最高能達到多少?如何提高?

如何解決中英文混合語句的語義分析問題(比如,“幫我呼叫stephen william hawking”)?中英文區分的難點在哪?

在深度學習的狀态下,機器能夠對使用者的語言習慣适應到什麼程度?能了解使用者的一些情緒上的語言習慣嗎(如諷刺等話語)?

搜狗與科大訊飛、思必馳等同行技術的差異化(包括語音識别、語義/邏輯分析)?

有沒有機會實作 google now 那樣的功能?比如語音調取應用,檢索其它應用内的資訊,自動給出答案。

<a href="http://www.leiphone.com/news/201612/ky5p6ze8xhkzh4aw.html" target="_blank">機器人聊天的秘密</a>

嘉賓介紹:亓超,自然語言處理方向碩士,ai領域開放域聊天和chatbot頂尖專家,10年科研與工程經驗。曾在佳能、騰訊、阿裡負責推薦算法和人機對話系統研發;2014年微軟小冰開放域聊天技術創始人;百度t8lead;度秘聊天技術負責人;從零寫了微軟小冰和百度度秘唯一兩款目前有實際應用的互動系統。

語義了解簡單來說,就是讓計算機聽懂使用者說了什麼,然後可以進一步回答使用者的問題或與使用者對話。這類技術在現實場景中的應用有大家比較熟知的微軟小冰與百度度秘。錘子手機中

bigbang 功能也是基于語義了解技術中的語義分析功能進行的創新。本期公開課請到了開放域聊天和 chatbot 頂尖專家——三角獸科技的

cto 亓超,為大家揭開機器人聊天的秘密。

本期公開課的主要内容:

目前語義了解技術主要用在哪些場景和應用裡?

相比做語音識别的公司,提供語義了解的團隊看似要少一些,其中的難點是什麼? 

了解中的語義了解公司往往需要大量标記好的語料資料,這些資料如何形成?

一個完整的聊天機器人或者多輪對話系統,應該包含哪些技術子產品?

詳細介紹下什麼是開放域聊天技術嗎?開放域聊天技術與傳統用關鍵字、模闆或者人工參與的聊天技術的不同之處是什麼?

本文作者:亞峰

繼續閱讀