天天看點

目标驅動系統模式,能否成為實作人工通用智能(AGI)的關鍵?

雲栖号資訊:【 點選檢視更多行業資訊

在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

自從人工智能誕生以來,研究人員們一直試圖通過讓機器人與人類玩遊戲來測試機器系統的智能水準。人們通常認為,人類智慧的一大标志,就在于具備創造性思考的能力——考慮多種多樣的可能性,并在制定短期決策的同時牢記長期目标。如果計算機能夠像人類一樣解決困難的遊戲,那麼它們肯定可以處理更為複雜的任務。從上世紀五十年代出現的早期跳棋機器人,到如今得到深度學習技術加持的新AI,智能系統已經能夠在國際象棋、圍棋以及《DOTA》等遊戲中擊敗全球頂尖人類選手。從這個角度來看,單純依靠解決謎題的能力來判斷機器智能水準的思路已經過時。要衡量AI的極限,我們還得找到更靠譜的方法。

目标驅動系統模式,能否成為實作人工通用智能(AGI)的關鍵?

是以,組織開發AI方案時采取的一大核心模式,正是目标驅動型系統模式。與其他AI模式一樣,這種形式的AI能夠解決一系列原本需要人類認知能力才能處理的常見問題。在這種特定模式下,機器的任務非常明确——找到解決問題的最佳途徑。具體問題可能是找到順利穿過迷宮的路徑、優化供應鍊或者優化駕駛路線與空閑時間。無論實際需求如何,我們對AI系統的期望都是通過反複試驗完成學習,并找到解決問題的最佳(即使直覺度很低)方法。

強化學習與實驗試錯學習

強化學習是目前使用比例不高、但卻最為有趣的機器學習形式之一。與監督學習方法(人類首先對資料做出标記,再由機器利用标記資料完成學習)或者無監督學習方法(由機器自主嘗試對資訊進行分組與聚類,借此完成學習)相反,強化學習主要通過實驗試錯的方式進行學習,并在疊代當中不斷比對環境回報與總體目标,最終達成理想性能。

在不使用AI的情況下,組織需要依靠人類建立基于程式與規則的系統,借此指導軟體與硬體系統的運作流程。程式與規則雖然能夠有效管理資金、人員、時間以及其他多種資源類型,但往往存在嚴重的脆弱與僵化局限。這些系統的能力上限,被牢牢束縛在人類所制定規則的水準身上;換句話說,這類機器根本無法真正學習,而隻是将人類智能以規則的形式重新了解,并借此保證系統的正常工作。

另一方面,目标學習型AI系統的規則數量非常有限,我們可以通過疊代幫助系統學會如何獨立工作。以此為基礎,AI能夠全面優化整個系統,而不必依賴于人類設定的易碎規則。目标驅動型系統在這方面證明了自己的價值,表明系統完全能夠從極具挑戰性的問題當中自行找到“隐藏規則”、并主效将其解決。也正因為如此,目标驅動型系統才在需要進行資源優化的領域當中迸發出巨大的能量。

AI技術能夠有效實作場景模拟與資源優化。通過将這種通用方法應用于學習當中,我們可以引導AI系統學會針對特定目标或方案的優化方向,并找出很多即使是擁有多年從業經驗的資深人類專家也難以發覺的解決方案。如此一來,盡管目标驅動型系統模式在普及度方面不及其他模式(例如識别、預測分析或者對話模式),但卻在衆多行業中顯示出巨大的發展潛力。

在金融領域,基于強化學習的目标驅動系統也在遍地開花。以“機器人咨詢”為例,這類方案通過自主學習發現衆多能夠滿足個人特定需求的儲蓄與投資計劃。目标驅動系統模式還能在控制交通信号燈系統方面發揮作用,找到最大程度保證流量通行能力的控制方式。供應鍊與物流行業也在使用此類系統尋求打包及配送貨物的最優方法。除此之外,訓練實體機器人、創造可指揮機器人行走及跳躍的算法等也都是目标驅動系統模式的理想施展舞台。

目标驅動系統甚至被應用于電子商務與廣告宣傳當中,負責幫助客戶找到最佳商品價格并自動給出廣告展示區報價。目标驅動系統甚至在制藥行業中計算蛋白質折疊,并找到發現疾病的創新方法。這些系統能夠選擇最佳試劑與反應參數,設計出所需産品,這種強大的能力也使其成為高度複雜的藥物或治療流程中的新型資産。

目标驅動型系統模式能否成為實作人工通用智能(AGI)的關鍵?

實驗試錯是種行之有效的好辦法,而且很可能适用于幾乎一切問題。值得一提的是,DeepMind是一家緻力于将機器智能變成現實的機構。該機構已經成功解決了一系列人們原本以為機器永遠無法解決的難題。在他們看來,強化學習型目标驅動系統很可能成為解鎖機器人終極形态的關鍵——這将是一台能夠學習一切知識、完成任何任務的機器。“通用智能”的概念類似于人類大腦,這意味着人工通用智能不再像目前已經存在的真實AI系統那樣隻能專注于狹窄的單一學習任務,而能夠學習到一切知識并将經驗心得從一個領域轉移到另一個領域——期間無需進行大量重新訓練。

DeepMind公司成立于英國,并于2014年接受了谷歌收購。他們希望突破目标驅動系統及其他AI模式的能力範圍,解決各類最複雜的機器智能問題。從設計專業級圍棋AI系統AlphaGo為起點,DeepMind方面又迅速開發出AlphaZero——後者能夠從零開始學習任何遊戲,并快速獲得遠超一般人類的技術水準。以往AlphaGo需要幾個月才能學習完成的對弈技巧,如今基于強化學習的AlphaZero已經能夠在短短幾天之内完成。從零開始,以提高勝率作為唯一目标,AlphaZero在多達100款測試遊戲中均将AlphaGo斬于馬下。

正如技術行業的從業者們樂于使用新興成果一樣,DeepMind也在努力将新的發現轉化為可能的實際應用。AlphaZero使用當時最尖端的技術建立而成,目前已經被用于推動神經科學及行為心理學等領域的研究。此外,人們還在利用這些技術開發強大的通用學習算法,也許人工通用智能領域的真正突破再有幾年就會初現端倪。

對整個人工智能行業來說,機器學習可以算是發展過程中的十字路口。目前,使用範圍最廣的算法主要負責解決重要但相對簡單的問題。盡管機器已經證明了自己有能力識别圖像、了解語音、發現模式、識别異常并做出預測,但這類算法在精确完成任務之前仍然需要大量訓練資料與狹窄的學習任務作為基礎。在這種情況下,機器學習需要耗費大量資料以及可觀的計算資源。如果想要解決的任務足夠複雜,那麼大家可能需要準備PB甚至更高數量級的訓練資料、投入數十萬美元租用GPU密集型計算資源并等待長達數個月時間。很明顯,單靠這樣的暴力手段,我們永遠不可能實作人工通用智能。

目标驅動型系統模式屬于目前七大主流AI模式當中使用頻率最低的一種,但卻也是最有可能突破資料與計算密集型樊籬的關鍵。好消息,是,如今目标驅動型系統正越來越多地在具有實際用例的項目中得到實施。憑借着光明的發展前景,它也成為其中最有趣、最值得期待的模式之一。

【雲栖号線上課堂】每天都有産品技術專家分享!

課程位址:

https://yqh.aliyun.com/live

立即加入社群,與專家面對面,及時了解課程最新動态!

【雲栖号線上課堂 社群】

https://c.tb.cn/F3.Z8gvnK

原文釋出時間:2020-06-04

本文來自:“

科技行者

”,了解相關資訊可以關注“

繼續閱讀