天天看點

專訪阿裡研究員袁全:從 AI 玩《星際争霸》談認知智能的現狀與趨勢

不同于以提升點選率和轉化率等優化名額為主的機器學習模型,認知計算以實作算法和智能化為核心,訓練智能體的自主學習能力,以及多個智能體之間的協作和配合能力,和原來優化大資料和算法具有很大的差別。近日,筆者就認知計算、應用場景、算法優化、深度學習以及雲計算&大資料技術的關系等問題與阿裡認知計算實驗室研究員、資深總監袁全進行了深入探讨。

專訪阿裡研究員袁全:從 AI 玩《星際争霸》談認知智能的現狀與趨勢

阿裡認知計算實驗室研究員、資深總監袁全(左一)

“人工智能時代,我們專注認知計算研究,以積累核心算法系統為首要目标”——袁全。

袁全的研究始于06年開始的個性化推薦,彼時他在ibm研究院率先研發這一新技術。在12年加入阿裡後,他主要負責手機淘寶、天貓的個性化推薦技術,包括算法、平台和産品的協同。袁全和他的團隊緻力于個性化推薦算法,典型産品有“有好貨”、“猜你喜歡”等。15-16年團隊主要研究淘寶首頁的全面個性化,在去年年中的時候,以alphago為代表的人工智能、認知決策技術的更新帶來了非常多的新理念和新技術,袁全所帶領的新團隊也轉戰認知計算這一領域,目标是在人工智能時代,積累核心算法系統和能力。

“最大的挑戰在于它是一個非常新的多種類交叉學科,涉及内腦科學、認知心理學、機器學習甚至是博弈論,是一個全新的開始”——袁全。

推薦是經典的機器學習&大資料任務,依賴于每天産生的上億使用者資料,而認知計算最核心的能力是實作算法的智能化,提升智能體的自主學習能力,對大資料依賴性會變弱。從商品推薦到認知計算這一轉變過程中,最重要的是要依靠認知科學來啟發算法的認知設計,袁全表示,因為人腦是我們唯一所知的具有舉一反三學習能力的物體,是以其中最大的挑戰就在于它是一個非常新的多種類的交叉學科,涉及腦科學、認知心理學、機器學習甚至是博弈論,是一個全新的開始。

專訪阿裡研究員袁全:從 AI 玩《星際争霸》談認知智能的現狀與趨勢

應用于《星際争霸》遊戲中的雙向協調網絡(bicnet)

深度學習作為認知學習中重要推動力和實驗工具,也已演化成研究智能的一個非常重要的平台,包括越來越多的國内外高校都在用深度學習去模拟人腦結構,尤其是深度神經網絡對人腦的羅列和實作能力。當然後續也會結合其他流派的一些算法,例如結合符号主義、機率推理等,進而實作更好的學習能力。

機遇與挑戰并存,更好的學習能力往往意味着更艱難的當下。袁全表示,在應用過程中,團隊不斷改進算法等技術,以期實作更佳的效果和使用者體驗。細化到算法調優上,不僅從agent通信機制間提高通信效率,還兼顧agent個體和全體收益,智能體的回報激勵機制優化、全局和動态資訊的組合運用等,使得模型的通用性和擴充能力大大增強。

不過随着智能發展的火爆,各種ai威脅論也随之發酵。從團隊的整個學習過程,以及alphago等例子來看,智能的學習能力确實很有可能超越人類,機器協同效率遠高于人的協同效率,很可能是一個催化要素,加之硬體和算法不斷進步,智能對人類的威脅的确可能存在。現在看來最好的方式,是開放研究、共享新技術,多方共同逼近和實作目标;同時在ai的機制設定上,多引導其往人類不擅長、解決不了的問題上進行,與人類形成良性協作,互相增強。

另外,袁全還談到了雲計算、大資料與認知學習的微妙關系。誠然,智能體的訓練對海量資料的處理能力提出了更高的要求,三者相輔相成,但是目前從很多的進展來看,小樣本學習的技術也在不斷提升,是以資料量級并非越大越好,學習能力越強的智能體對資料的依賴程度越低,這也是一個新的認知。

“引進智能化,理想情況就是說,每個使用者背後都會有個智能體在專注地為他服務”——袁全。

在研究認知計算的過程中,袁全的團隊由淺入深,不斷補綴;結合ai在推薦等領域的應用,袁全認為利用ai去解決推薦的驚喜性問題,是一個技術和商業的很好結合。基于ai提供使用者需要但自身并未意識到的商品和資訊服務,逐漸引進智能化,理想情況就是說,每個使用者背後都會有個智能體在專注地為他服務。

對于想要從事個性化推薦、認知計算、通用智能的同學,袁全表示,紮實的功底必不可少,包括基礎的程式設計能力和數學能力。在此之上,再根據個人的特點選擇分支:甚至是一些偏深入研究的方向,例如,受腦神經科學啟發的認知學習機制;或者選擇通用智能領域,很多做通用智能的人都具有紮實的機器學習、強化學習背景;最後是非常重要的工程和系統架構能力,這是實作智能必不可少的一點。

繼續閱讀