天天看點

CCAI 2017 | 小資料學習對人工智能究竟有着怎樣的影響?

近幾年來,得益于大資料的積累、計算能力的提升,深度學習從學術到工程領域均取得了非常顯著的發展與突破,尤其是諸如圖像識别、語音識别等實際場景應用。但是,依賴于海量的訓練資料、靈活的模型、足夠的運算能力以及足以對抗次元災難的先驗經驗,從很大程度上來講妨礙了深度學習技術更為廣泛的運用。為此,在全球範圍内,衆多人工智能領域的學術大師及業界專家上下求索,也由此催生了小資料學習(learning from limited information),通過更少的資料以及更确定的方法讓 ai 學習更加高效。

然而什麼是小資料?機器怎樣從小資料中學習?小資料學習将從哪些方面改變人工智能的研究與應用?在即将于 7 月 22 - 23 日舉行的中國人工智能大會(ccai 2017)上,特别邀請到日本理化學研究所先進智能研究中心主任 masashi sugiyama,現場為所有參會者一解小資料學習之惑,并分享其團隊在監督弱化分類方面的最新研究進展。在會前,記者特别采訪了 masashi sugiyama 教授,接下來,讓我們一起先睹為快。

CCAI 2017 | 小資料學習對人工智能究竟有着怎樣的影響?

masashi sugiyama 是日本理化學研究所先進智能項目組主任( director of riken advanced intelligence project)。riken 成立于 1917 年,是日本最大的綜合研究機構,其中,由 masashi sugiyama 上司的先進智能項目組成立于 2016 年,主要着眼于研發下一代 ai 技術,如小資料學習、因果推理(causal inference)、不确定性學習(learning with uncertainty)以及假設檢驗等,同時,還有加速醫學、材料科學、制造業的科研程序,解決基礎設施管理、社會抗災能力、老年醫療保健等社會問題。而 masashi sugiyama 教授本人的研究領域則包括機器學習的理論和算法(如協變量适應、密度比預估和強化學習等),及其在實際問題中的應用。

<b>記者:什麼是小資料學習?為什麼要使用小資料學習?如何實作?</b>

masashi sugiyama:雖然現在大資料學習仍是主流,但在很多應用領域,收集到足夠機器用來學習的龐大的資料是非常昂貴的。在這種情況下,使用小資料進行學習是一個理想的解決方式。但也有它的弊端,因為當進行小資料學習時,我們需要目标領域中強大的先驗知識作為支撐,過多先驗知識的介入意味着犧牲掉機器學習的靈活性。是以使用有限資訊進行學習的精髓在于,使用領域知識之外的相對便宜的資料進行學習。

<b>記者:若小資料學習能夠成功,将對哪些 ai 領域造成改變,進而對哪些行業産生影響?</b>

masashi sugiyama:利用小資料進行學習是大資料學習的母集,是以說它一方面可以解決大資料學習不能解決的問題,另一方面在大資料學習已經得以應用的領域也能有所發揮,因為使用小資料學習能夠在避免使用昂貴資料的同時達到更優的效果。

<b>記者:您和您的團隊在小資料學習方面已經取得了哪些進展?</b>

masashi sugiyama:多樣性對于小資料學習至關重要,因為對于不同的應用場景,收集資料的局限性是不同的。我們正在研發一種通用的算法使其解決機器學習過程中的不同問題,例如将很多不同種類的未标注資料集進行分類、将标注與未标注資料進行分類、半監督學習中的分類問題、充分标注的資料的分類問題等。

<b>記者:日本的科研機構更傾向于哪些 ai 技術及應用的研究?哪些 ai 應用在日本已經落地?</b>

masashi sugiyama:日本的機器學習研究人員更多地關注基礎研究,當然,同時也會有一些人在科學及工程領域從事應用科學相關的研究工作。在基礎研究與應用之間存在很大的鴻溝,如何搭建鴻溝上的橋梁至關重要。所幸,這些建橋的工作在一些領域已經逐漸展開,例如對癌症及老年癡呆的研究、再生醫學、制造業、基礎設施管理以及抗災能力提升的研究等方面。

<b>記者:您認為目前 ai 技術發展的瓶頸在哪兒?并請展望 ai 未來的發展方向。</b>

masashi sugiyama:私密性、安全性、以及倫理問題會成為人工智能系統發展的瓶頸。在 ai 技術發展之外,如何分析及管理 ai 可能帶來的社會問題也是需要重視的方面。

<b>記者:在本屆 ccai 現場,您将帶來的演講主要關于哪些方面?希望觀衆從中收獲怎樣的啟發?</b>

masashi sugiyama:我的演講題目是《弱監督學習的最新研究進展》,在演講中我将介紹我們對于弱監督學習下的分類問題的研究成果,包括将兩種類别的無标簽資料進行分類、将有标簽與無标簽資料進行分類、一個對于半監督分類問題的通用方法、以及對于有标簽資料的分類。最後,我将簡單介紹日本理化學研究所先進智能項目組(riken aip)。

<b>關于 ccai</b>

中國人工智能大會(ccai),由中國人工智能學會發起,目前已成功舉辦兩屆,是中國國内級别最高、規模最大的人工智能大會。秉承前兩屆大會宗旨,由中國人工智能學會、阿裡巴巴集團 &amp; 螞蟻金服主辦,csdn、中國科學院自動化研究所承辦,雲栖社群作為獨家直播合作夥伴的第三屆中國人工智能大會(ccai 2017)将于 7 月 22-23 日在杭州召開。

作為中國國内高規格、規模空前的人工智能大會,本次大會由中國科學院院士、中國人工智能學會副理事長譚鐵牛,阿裡巴巴技術委員會主席王堅,香港科技大學計算機系主任、aaai fellow 楊強,螞蟻金服副總裁、首席資料科學家漆遠,南京大學教授、aaai fellow 周志華共同甄選出在人工智能領域本年度海内外最值得關注的學術與研發進展,彙聚了超過 40 位頂級人工智能專家,帶來 9 場權威主題報告,以及“語言智能與應用論壇”、“智能金融論壇”、“人工智能科學與藝術論壇”、“人工智能青年論壇”4 大專題論壇,屆時将有超過 2000 位人工智能專業人士參與。

繼續閱讀