專訪阿裡研究員袁全：從 AI 玩《星際争霸》談認知智能的現狀與趨勢

不同于以提升點選率和轉化率等優化名額為主的機器學習模型，認知計算以實作算法和智能化為核心，訓練智能體的自主學習能力，以及多個智能體之間的協作和配合能力，和原來優化大資料和算法具有很大的差別。近日，筆者就認知計算、應用場景、算法優化、深度學習以及雲計算&大資料技術的關系等問題與阿裡認知計算實驗室研究員、資深總監袁全進行了深入探讨。

阿裡認知計算實驗室研究員、資深總監袁全（左一）

“人工智能時代，我們專注認知計算研究，以積累核心算法系統為首要目标”——袁全。

袁全的研究始于06年開始的個性化推薦，彼時他在ibm研究院率先研發這一新技術。在12年加入阿裡後，他主要負責手機淘寶、天貓的個性化推薦技術，包括算法、平台和産品的協同。袁全和他的團隊緻力于個性化推薦算法，典型産品有“有好貨”、“猜你喜歡”等。15-16年團隊主要研究淘寶首頁的全面個性化，在去年年中的時候，以alphago為代表的人工智能、認知決策技術的更新帶來了非常多的新理念和新技術，袁全所帶領的新團隊也轉戰認知計算這一領域，目标是在人工智能時代，積累核心算法系統和能力。

“最大的挑戰在于它是一個非常新的多種類交叉學科，涉及内腦科學、認知心理學、機器學習甚至是博弈論，是一個全新的開始”——袁全。

推薦是經典的機器學習&大資料任務，依賴于每天産生的上億使用者資料，而認知計算最核心的能力是實作算法的智能化，提升智能體的自主學習能力，對大資料依賴性會變弱。從商品推薦到認知計算這一轉變過程中，最重要的是要依靠認知科學來啟發算法的認知設計，袁全表示，因為人腦是我們唯一所知的具有舉一反三學習能力的物體，是以其中最大的挑戰就在于它是一個非常新的多種類的交叉學科，涉及腦科學、認知心理學、機器學習甚至是博弈論，是一個全新的開始。

應用于《星際争霸》遊戲中的雙向協調網絡（bicnet）

深度學習作為認知學習中重要推動力和實驗工具，也已演化成研究智能的一個非常重要的平台，包括越來越多的國内外高校都在用深度學習去模拟人腦結構，尤其是深度神經網絡對人腦的羅列和實作能力。當然後續也會結合其他流派的一些算法，例如結合符号主義、機率推理等，進而實作更好的學習能力。

機遇與挑戰并存，更好的學習能力往往意味着更艱難的當下。袁全表示，在應用過程中，團隊不斷改進算法等技術，以期實作更佳的效果和使用者體驗。細化到算法調優上，不僅從agent通信機制間提高通信效率，還兼顧agent個體和全體收益，智能體的回報激勵機制優化、全局和動态資訊的組合運用等，使得模型的通用性和擴充能力大大增強。

不過随着智能發展的火爆，各種ai威脅論也随之發酵。從團隊的整個學習過程，以及alphago等例子來看，智能的學習能力确實很有可能超越人類，機器協同效率遠高于人的協同效率，很可能是一個催化要素，加之硬體和算法不斷進步，智能對人類的威脅的确可能存在。現在看來最好的方式，是開放研究、共享新技術，多方共同逼近和實作目标；同時在ai的機制設定上，多引導其往人類不擅長、解決不了的問題上進行，與人類形成良性協作，互相增強。

另外，袁全還談到了雲計算、大資料與認知學習的微妙關系。誠然，智能體的訓練對海量資料的處理能力提出了更高的要求，三者相輔相成，但是目前從很多的進展來看，小樣本學習的技術也在不斷提升，是以資料量級并非越大越好，學習能力越強的智能體對資料的依賴程度越低，這也是一個新的認知。

“引進智能化，理想情況就是說，每個使用者背後都會有個智能體在專注地為他服務”——袁全。

在研究認知計算的過程中，袁全的團隊由淺入深，不斷補綴；結合ai在推薦等領域的應用，袁全認為利用ai去解決推薦的驚喜性問題，是一個技術和商業的很好結合。基于ai提供使用者需要但自身并未意識到的商品和資訊服務，逐漸引進智能化，理想情況就是說，每個使用者背後都會有個智能體在專注地為他服務。

對于想要從事個性化推薦、認知計算、通用智能的同學，袁全表示，紮實的功底必不可少，包括基礎的程式設計能力和數學能力。在此之上，再根據個人的特點選擇分支：甚至是一些偏深入研究的方向，例如，受腦神經科學啟發的認知學習機制；或者選擇通用智能領域，很多做通用智能的人都具有紮實的機器學習、強化學習背景；最後是非常重要的工程和系統架構能力，這是實作智能必不可少的一點。

專訪阿裡研究員袁全：從 AI 玩《星際争霸》談認知智能的現狀與趨勢

繼續閱讀

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希